强化学习教程: 09-Exploration and Exploitation
欢迎转载,作者:Ling,注明出处:强化学习教程: 09-Exploration and Exploitation 本章主要讲解了强化学习中一个基本的权衡问题,就是探索与开发的问题,这是…
93
文章
54451
评论
1
邻居
欢迎转载,作者:Ling,注明出处:强化学习教程: 09-Exploration and Exploitation 本章主要讲解了强化学习中一个基本的权衡问题,就是探索与开发的问题,这是…
欢迎转载,作者:Ling,注明出处:强化学习教程: 08-Model-Based RL Dyna and Tree Search 上一章是从经验(Experience)中学策略(Poli…
欢迎转载,作者:Ling,注明出处:强化学习教程: 07-Model-Free Policy Gradient and Actor-Critic 前面所介绍的都是Value-Based …
欢迎转载,作者:Ling,注明出处:强化学习教程: 06-Model-Free Control, DQN 本章主要介绍 DQN 大规模强化学习: 到目前为止,我们的value funct…
欢迎转载,作者:Ling,注明出处:强化学习教程: 05-Model-Free Control, Sarsa, Sarsa(λ)和Q-learning 本章主要介绍: MC…
欢迎转载,作者:Ling,注明出处:强化学习教程: 04-Model-Free Evaluation, MC,TD and TD(λ) 本章主要内容: 蒙特卡洛学习:Mon…
欢迎转载,作者:Ling,注明出处:强化学习教程: 03-Policy Iteration and Value Iteration 本章主要内容: 动态规划:Dynamic Programming 迭…
欢迎转载,作者:Ling,注明出处:强化学习教程: 02-MDP 几乎所有的强化学习问题都可以转化为马尔科夫决策过程,所以我们文主要介绍以下内容: 马尔科夫过程:Markov Proce…
欢迎转载,作者:Ling,注明出处:强化学习教程: 01-概述 强化学习定义: Reinforcement learning is learning what to do|how to …