AI – Ling之博客

强化学习教程: 06-Model-Free Control, DQN

欢迎转载，作者：Ling，注明出处：强化学习教程: 06-Model-Free Control, DQN 本章主要介绍 DQN 大规模强化学习：到目前为止，我们的value funct…

欢迎转载，作者：Ling，注明出处：强化学习教程: 05-Model-Free Control, Sarsa, Sarsa(λ)和Q-learning 本章主要介绍： MC…

欢迎转载，作者：Ling，注明出处：强化学习教程: 04-Model-Free Evaluation, MC,TD and TD(λ) 本章主要内容：蒙特卡洛学习：Mon…

欢迎转载，作者：Ling，注明出处：强化学习教程: 03-Policy Iteration and Value Iteration 本章主要内容：动态规划：Dynamic Programming 迭…

欢迎转载，作者：Ling，注明出处：强化学习教程: 02-MDP 几乎所有的强化学习问题都可以转化为马尔科夫决策过程，所以我们文主要介绍以下内容：马尔科夫过程：Markov Proce…

欢迎转载，作者：Ling，注明出处：强化学习教程: 01-概述强化学习定义： Reinforcement learning is learning what to do|how to …

欢迎转载，作者：Ling，注明出处：AI Top Papers 2013-2017总结如有遗漏，敬请告知，今后以后我会不断更新。过去的5年可以说是AI大放异彩的五年，大到国家，小到公司，企业，个人…

欢迎转载，作者：Ling，注明出处：机器学习：原理简明教程13-降维与LDA，PCA，因子分解一句话概括（LDA）：就是要找到一个向量，通过它进行投影，投影后可分，为了得到该向量，提出…

欢迎转载，作者：Ling，注明出处：机器学习：原理简明教程12-主题模型一句话概括（SVD）：SVD通过矩阵的分解，分解成三个矩阵的相乘，其中隐含的行或者列就是隐藏的主题。一句话概括（pLSA）：…

欢迎转载，作者：Ling，注明出处：机器学习：原理简明教程10-HMM 一句话概括：隐马尔科夫模型是一个三元组，包含状态转移矩阵，发射矩阵以及初始状态，可以解决三类问题，计算模型下观测序…