妙思文献管理集成系统WWW检索

书目信息

表格格式
工作单格式
卡片格式

题名：	深度强化学习实践
作者：	拉潘著；林然，王薇译
分册：
出版信息：	北京机械工业出版社 2021
页数：	xvii, 617页
开本：	24cm
丛书名：	智能系统与技术丛书
单册：
中图分类：	TP181
科图分类：
主题词：	机器学习--ji qi xue xi--算法
电子资源：
ISBN：	978-7-111-68738-2

000	01853nam0 2200337 450
001	2141167736
005	20211029093429.85
010		@a978-7-111-68738-2@dCNY149.00
035		@aCAL 012021113864
099		@aCAL 012021113864
100		@a20210906d2021 em y0chiy50 ea
101	1	@achi@ceng
102		@aCN@b110000
105		@aak z 000yy
200	1	@a深度强化学习实践@Ashen du qiang hua xue xi shi jian@f(俄) 马克西姆·拉潘著@d= Deep reinforcement learning hands-on@fMaxim Lapan@g林然, 王薇译@zeng
210		@a北京@c机械工业出版社@d2021
215		@axvii, 617页@c图@d24cm
225	2	@a智能系统与技术丛书@Azhi neng xi tong yu ji shu cong shu
305		@a译自原书第2版
306		@a本书中文简体字版由Packt Publishing授权机械工业出版社独家出版
314		@a马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士。
330		@a本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。
410	0	@12001 @a智能系统与技术丛书
500	10	@aDeep reinforcement learning hands-on@mChinese
606	0	@a机器学习@Aji qi xue xi@x算法
690		@aTP181@v5
701	1	@a拉潘@Ala pan@g(Lapan, Maxim)@4著
702	0	@a林然@Alin ran@4译
702	0	@a王薇@Awang wei@4译
801	0	@aCN@b湖北三新@c20210906
905		@a241250@dTP181@e93

深度强化学习实践/(俄) 马克西姆·拉潘著= Deep reinforcement learning hands-on/Maxim Lapan/林然, 王薇译.-北京：机械工业出版社，2021

xvii, 617页：图；24cm.-(智能系统与技术丛书)

ISBN 978-7-111-68738-2：CNY149.00

本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。

●

序号	登录号	条形码	馆藏地/架位号	状态	备注
1	1907918	219079182	样本书库/ [索取号:TP181/93]	在馆
2	1907919	219079191	新区/5100080503/ [索取号:TP181/93]	在馆
3	1907920	219079208	新区/5100080503/ [索取号:TP181/93]	在馆