欢迎来到 黑吧安全网聚焦网络安全前沿资讯,精华内容,交流技术心得!

深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码

  • 软件大小:0 Bytes
  • 软件语言:简体中文
  • 软件类型:电子书
  • 软件授权:免费软件
  • 更新时间:2019-02-25
  • 标签:
  • 开 发 商:Home Page
  • 应用平台:XP/Win7/Win8/Win10
软件评分
网友评分:5

同类人气软件

立即下载

深入浅出强化学习:原理入门 中文pdf完整版[112MB] 含源代码软件介绍

《深入浅出强化学习:原理入门》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。

基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习:原理入门》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。

目录
1 绪论 1
第一篇 强化学习基础 17
2 马尔科夫决策过程 18
3 基于模型的动态规划方法 36
第二篇 基于值函数的强化学习方法 57
4 基于蒙特卡罗的强化学习方法 58
5 基于时间差分的强化学习方法 75
6 基于值函数逼近的强化学习方法 88
第三篇 基于直接策略搜索的强化学习方法 125
7 基于策略梯度的强化学习方法 126
8 基于置信域策略优化的强化学习方法 142
9 基于确定性策略搜索的强化学习方法 165
10 基于引导策略搜索的强化学习方法 171
第四篇 强化学习研究及前沿 185
11 逆向强化学习 186
12 组合策略梯度和值函数方法 202
13 值迭代网络 207
14 基于模型的强化学习方法:PILCO及其扩展 214
  • 热门下载