• 首页
  • 本馆介绍
  • 公告通知
  • 最新文献
  • 馆藏检索
  • 电子资源
  • 读者导购
  • 参考咨询
  • 我的图书馆
  • 登录
  • 详细信息显示
  • 放入我的书架
  • 预约/预借图书
  • 作者相关作品
  • 分类相关作品
  • 丛书相关作品
  • 出版社相关作品

书目信息

  • 表格格式
  • 工作单格式
  • 卡片格式
题名:
深度强化学习实践
    
 
作者: 拉潘 著 ;林然 , 王薇 译
分册:  
出版信息: 北京   机械工业出版社  2021
页数: xvii, 617页
开本: 24cm
丛书名: 智能系统与技术丛书
单 册:
中图分类: TP181
科图分类:
主题词: 机器学习--ji qi xue xi--算法
电子资源:
ISBN: 978-7-111-68738-2
000 01853nam0 2200337 450
001 2141167736
005 20211029093429.85
010    @a978-7-111-68738-2@dCNY149.00
035    @aCAL 012021113864
099    @aCAL 012021113864
100    @a20210906d2021 em y0chiy50 ea
101 1  @achi@ceng
102    @aCN@b110000
105    @aak z 000yy
200 1  @a深度强化学习实践@Ashen du qiang hua xue xi shi jian@f(俄) 马克西姆·拉潘著@d= Deep reinforcement learning hands-on@fMaxim Lapan@g林然, 王薇译@zeng
210    @a北京@c机械工业出版社@d2021
215    @axvii, 617页@c图@d24cm
225 2  @a智能系统与技术丛书@Azhi neng xi tong yu ji shu cong shu
305    @a译自原书第2版
306    @a本书中文简体字版由Packt Publishing授权机械工业出版社独家出版
314    @a马克西姆·拉潘, 一位深度学习爱好者和独立研究者。林然, 在2016年加入Thoughtworks之后, 主要担任全栈软件开发工程师。王薇, 北京邮电大学硕士。
330    @a本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。
410  0 @12001 @a智能系统与技术丛书
500 10 @aDeep reinforcement learning hands-on@mChinese
606 0  @a机器学习@Aji qi xue xi@x算法
690    @aTP181@v5
701  1 @a拉潘@Ala pan@g(Lapan, Maxim)@4著
702  0 @a林然@Alin ran@4译
702  0 @a王薇@Awang wei@4译
801  0 @aCN@b湖北三新@c20210906
905    @a241250@dTP181@e93
    
    深度强化学习实践/(俄) 马克西姆·拉潘著= Deep reinforcement learning hands-on/Maxim Lapan/林然, 王薇译.-北京:机械工业出版社,2021
    xvii, 617页:图;24cm.-(智能系统与技术丛书)
    
    
    ISBN 978-7-111-68738-2:CNY149.00
    本书介绍了强化学习的基础知识, 以及如何动手编写智能体以执行一系列实际任务。本书首先介绍强化学习的概念、OpenAI Gym库以及PyTorch库。接着分别介绍几种强化学习方法: 交叉熵、Q-learning、DQN及其扩展以及高级强化学习库。然后介绍策略梯度及其扩展的A2C、A3C方法, 并研究可以使用策略梯度方法解决的实际问题: 使用RL训练聊天机器人、通过TextWorld环境解决基于文本的文字冒险游戏、Web导航和浏览器自动化。之后介绍连续控制问题、机器人技术中的强化学习、置信域方法等高级强化学习部分。接着介绍另一套RL方法: 黑盒优化。最后讨论RL的高级探索、基于模型的方法、AlphaGo Zero、离散优化、多智能体强化学习。
●
相关链接


正题名:深度强化学习实践     索取号:TP181/93         预约/预借

序号 登录号 条形码 馆藏地/架位号 状态 备注
1 1907918   219079182   样本书库/ [索取号:TP181/93] 在馆    
2 1907919   219079191   新区/5100080503/ [索取号:TP181/93] 在馆    
3 1907920   219079208   新区/5100080503/ [索取号:TP181/93] 在馆    
商丘师范学院图书馆 欢迎您!
大连网信软件有限公司© 版权所有