| ISBN/价格: | 978-7-302-68471-8:CNY79.00 |
|---|---|
| 作品语种: | eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | Lessons from alphazero for optimal, model predictive, and adaptive control/.博塞克斯著 |
| 版本项: | 影印版 |
| 出版发行项: | 北京:,清华大学出版社:,2025 |
| 载体形态项: | xiv, 227页:;+图:;+24cm |
| 丛编项: | 国际知名大学原版教材.信息技术学科与电气工程学科系列 |
| 提要文摘: | 本书构建了近似动态规划和强化学习的新的理论框架, 简洁但雄心勃勃。这一框架以离线训练和在线学习这两个算法为中心, 彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩。在看似纷繁复杂的数据与算法表象之下, 其实蕴藏着简洁而美妙的规律。通过本书的学习, 读者将能体会经典优化控制理论在分析理解当代强化学习算法性能中的强大威力, 更能领悟到以阿尔法零为代表的新一代算法浪潮对经典理论提供的新的发展机遇。 |
| 并列题名: | 阿尔法零对最优模型预测自适应控制的启示 chi |
| 题名主题: | 人工智能 自适应控制 高等学校 英文 教材 |
| 中图分类: | TP181 |
| 个人名称等同: | 博塞克斯 著 |
| 记录来源: | CN SDL 20260128 |