书目信息 |
题名: |
深度强化学习实践
|
|
作者: | 拉潘 著 ;林然 , 王薇 译 | |
分册: | ||
出版信息: | 北京 机械工业出版社 2021 |
|
页数: | xvii, 617页 | |
开本: | 24cm | |
丛书名: | 智能系统与技术丛书 | |
单 册: | ||
中图分类: | TP181 | |
科图分类: | ||
主题词: | 机器学习--ji qi xue xi--算法 | |
电子资源: | ||
ISBN: | 978-7-111-68738-2 |
000 | 01853nam0 2200337 450 | |
001 | 2141167736 | |
005 | 20211029093429.85 | |
010 | @a978-7-111-68738-2@dCNY149.00 | |
035 | @aCAL 012021113864 | |
099 | @aCAL 012021113864 | |
100 | @a20210906d2021 em y0chiy50 ea | |
101 | 1 | @achi@ceng |
102 | @aCN@b110000 | |
105 | @aak z 000yy | |
200 | 1 | @a深度强化学习实践@Ashen du qiang hua xue xi shi jian@f(俄) 马克西姆·拉潘著@d= Deep reinforcement learning hands-on@fMaxim Lapan@g林然, 王薇译@zeng |
210 | @a北京@c机械工业出版社@d2021 | |
215 | @axvii, 617页@c图@d24cm | |
225 | 2 | @a智能系统与技术丛书@Azhi neng xi tong yu ji shu cong shu |
305 | @a译自原书第2版 | |
306 | @a本书中文简体字版由Packt Publishing授权机械工业出版社独家出版 | |
314 | @a马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士。 | |
330 | @a本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。 | |
410 | 0 | @12001 @a智能系统与技术丛书 |
500 | 10 | @aDeep reinforcement learning hands-on@mChinese |
606 | 0 | @a机器学习@Aji qi xue xi@x算法 |
690 | @aTP181@v5 | |
701 | 1 | @a拉潘@Ala pan@g(Lapan, Maxim)@4著 |
702 | 0 | @a林然@Alin ran@4译 |
702 | 0 | @a王薇@Awang wei@4译 |
801 | 0 | @aCN@b湖北三新@c20210906 |
905 | @a241250@dTP181@e93 | |
深度强化学习实践/(俄) 马克西姆·拉潘著= Deep reinforcement learning hands-on/Maxim Lapan/林然, 王薇译.-北京:机械工业出版社,2021 |
xvii, 617页:图;24cm.-(智能系统与技术丛书) |
ISBN 978-7-111-68738-2:CNY149.00 |
本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。 |
● |
相关链接 |
正题名:深度强化学习实践
索取号:TP181/93
 
预约/预借
序号 | 登录号 | 条形码 | 馆藏地/架位号 | 状态 | 备注 |
1 | 1907918 | 219079182 | 样本书库/ [索取号:TP181/93] | 在馆 | |
2 | 1907919 | 219079191 | 新区/5100080503/ [索取号:TP181/93] | 在馆 | |
3 | 1907920 | 219079208 | 新区/5100080503/ [索取号:TP181/93] | 在馆 |