от
Я учусь РЛ из книги Deep_Reinforcement_Learning_Hands-на Максима Лапан. Вот их код для усиления алгоритма. https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On/blob/master/Chapter09/02_cartpole_reinforce.py Но хочу реализовать этот код без использования библиотек ptan, а я так и не понял, что он делает. Я пытался сделать код ниже
env = gym.make("CartPole

Но это не сходится вообще, награда не более 10

Ваш ответ

Отображаемое имя (по желанию):
Конфиденциальность: Ваш электронный адрес будет использоваться только для отправки уведомлений.
Анти-спам проверка:
Чтобы избежать проверки в будущем, пожалуйста войдите или зарегистрируйтесь.
...