
会员
统计策略搜索强化学习方法及应用
更新时间:2021-10-29 12:05:40
最新章节:彩插开会员,本书免费读 >
智能体AlphaGo战胜人类围棋专家刷新了人类对人工智能的认识,也使得其核心技术强化学习受到学术界的广泛关注。本书正是在如此背景下,围绕作者多年从事强化学习理论及应用的研究内容及国内外关于强化学习的最近动态等方面展开介绍,是为数不多的强化学习领域的专业著作。该著作侧重于基于直接策略搜索的强化学习方法,结合了统计学习的诸多方法对相关技术及方法进行分析、改进及应用。本书以一个全新的现代角度描述策略搜索强化学习算法。从不同的强化学习场景出发,讲述了强化学习在实际应用中所面临的诸多难题。针对不同场景,给定具体的策略搜索算法,分析算法中估计量和学习参数的统计特性,并对算法进行应用实例展示及定量比较。特别地,本书结合强化学习前沿技术将策略搜索算法应用到机器人控制及数字艺术渲染领域,给人以耳目一新的感觉。最后根据作者长期研究经验,对强化学习的发展趋势进行了简要介绍和总结。本书取材经典、全面,概念清楚,推导严密,以期形成一个集基础理论、算法和应用为一体的完备知识体系。
上架时间:2021-08-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
统计策略搜索强化学习方法及应用最新章节
查看全部- 彩插
- 参考文献
- 8.6 本章小结
- 8.5 实验与结果
- 8.4 A4系统用户界面
- 8.3 离线艺术风格学习阶段
- 8.2 基于强化学习的笔刷智能体建模
- 8.1 研究背景
- 第8章 基于逆强化学习的艺术风格学习及水墨画渲染
- 参考文献
最新上架
- 会员
关节故障空间机械臂容错运动控制技术
本书基于作者多年来承担航天领域重大项目及其他国家级项目取得的研究成果,对空间机械臂的容错运动控制等相关基本理论和方法进行系统且深入的介绍。本书共8章,主要内容包括空间机械臂概述、空间机械臂的关节故障及容错技术、关节故障空间机械臂数学模型、关节故障空间机械臂运动能力分析、关节锁定故障空间机械臂容错运动控制策略、关节自由摆动故障空间机械臂容错运动控制策略、关节部分失效故障空间机械臂容错运动控制策略以及工业16.7万字 - 会员
移动机器人导航定位技术
本书针对移动机器人中涉及的主要无线导航定位技术的最新研究成果进行了论述,涵盖了近年来作者团队在无线导航定位技术路径规划、定位算法及系统构架等方面取得的成果。全书共6章,第1章从移动机器人的概念入手,回顾了其发展历程和关键技术,深入探讨了导航定位的概念、分类及其发展趋势;第2章详细介绍了移动机器人涉及的各种导航定位技术;第3章详细介绍了UWB定位技术的特点、应用及系统构成,深入介绍了UWB脉冲的产生工业23.7万字 - 会员
机器人手工制作
随着信息化、数字化时代的到来,形态各异的机器人正在走进人们的视野。浩瀚宇宙、广袤天空、无垠大海、苍茫大地,机器人无所不在。本书精选了滑雪机器人、快递小哥机器人、三角形机器人、拉车机器人、大脚机器人、蟹脚机器人、爬行机器人、运动健身机器人、鸭子机器人、游泳机器人10个机器人进行制作,制作过程中必须手脑并用,其中处处体现数学、物理等知识。本书介绍的机器人制作成本极低,读者却可以了解真正机器人的工作原理工业3.7万字