强化学习

强化学习教程: 05-Model-Free Control, Sarsa, Sarsa(λ)和Q-learning

欢迎转载，作者：Ling，注明出处：强化学习教程: 05-Model-Free Control, Sarsa, Sarsa(λ)和Q-learning 本章主要介绍： MC…

欢迎转载，作者：Ling，注明出处：强化学习教程: 04-Model-Free Evaluation, MC,TD and TD(λ) 本章主要内容：蒙特卡洛学习：Mon…

欢迎转载，作者：Ling，注明出处：强化学习教程: 03-Policy Iteration and Value Iteration 本章主要内容：动态规划：Dynamic Programming 迭…

欢迎转载，作者：Ling，注明出处：强化学习教程: 02-MDP 几乎所有的强化学习问题都可以转化为马尔科夫决策过程，所以我们文主要介绍以下内容：马尔科夫过程：Markov Proce…

欢迎转载，作者：Ling，注明出处：强化学习教程: 01-概述强化学习定义： Reinforcement learning is learning what to do|how to …

自定义皮肤单栏布局玻璃菜单主体内容背景