10月 – 2018 – Ling之博客

强化学习教程: 09-Exploration and Exploitation

欢迎转载，作者：Ling，注明出处：强化学习教程: 09-Exploration and Exploitation 本章主要讲解了强化学习中一个基本的权衡问题，就是探索与开发的问题，这是…

欢迎转载，作者：Ling，注明出处：强化学习教程: 08-Model-Based RL Dyna and Tree Search 上一章是从经验(Experience)中学策略(Poli…

欢迎转载，作者：Ling，注明出处：强化学习教程: 07-Model-Free Policy Gradient and Actor-Critic 前面所介绍的都是Value-Based …

欢迎转载，作者：Ling，注明出处：强化学习教程: 06-Model-Free Control, DQN 本章主要介绍 DQN 大规模强化学习：到目前为止，我们的value funct…

欢迎转载，作者：Ling，注明出处：强化学习教程: 05-Model-Free Control, Sarsa, Sarsa(λ)和Q-learning 本章主要介绍： MC…

欢迎转载，作者：Ling，注明出处：强化学习教程: 04-Model-Free Evaluation, MC,TD and TD(λ) 本章主要内容：蒙特卡洛学习：Mon…

欢迎转载，作者：Ling，注明出处：强化学习教程: 03-Policy Iteration and Value Iteration 本章主要内容：动态规划：Dynamic Programming 迭…

欢迎转载，作者：Ling，注明出处：强化学习教程: 02-MDP 几乎所有的强化学习问题都可以转化为马尔科夫决策过程，所以我们文主要介绍以下内容：马尔科夫过程：Markov Proce…

欢迎转载，作者：Ling，注明出处：强化学习教程: 01-概述强化学习定义： Reinforcement learning is learning what to do|how to …