智能控制与强化学习:先进值迭代评判设计在线阅读
会员

智能控制与强化学习:先进值迭代评判设计

王鼎 赵明明 哈明鸣 任进
开会员,本书免费读 >

计算机网络人工智能8.7万字

更新时间:2025-01-09 17:01:03 最新章节:后记

立即阅读
加书架
下载
听书

书籍简介

在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次,基于迭代历史信息,提出一种新颖的收敛速度可调节的值迭代算法,有助于加快学习速度、减少计算代价,更高效地获得非线性系统的最优控制律。结合人工智能技术,对无模型值迭代评判学习控制的发展前景也进行了讨论。本书内容丰富、结构清晰、由浅入深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。
品牌:人邮图书
上架时间:2024-03-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

王鼎 赵明明 哈明鸣 任进
主页

同类热门书

最新上架

  • 会员
    本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。
    杨晓雷主编计算机23.9万字
  • 我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
    (美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
  • 会员
    本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络
    叶翰嘉 詹德川计算机19.3万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 会员
    本书从基础的神经网络、卷积神经网络、循环神经网络等入门知识,到深度学习的应用领域如计算机视觉、自然语言处理等高级主题都有涉及,可以帮助读者更好地理解深度学习知识,并为未来的职业发展打下坚实的基础。
    段小手计算机23.6万字
  • 会员
    本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。
    朱建明计算机16万字
  • 会员
    本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle
    刘润森计算机0字
  • 会员
    DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
    未来智能实验室 代晶编著计算机17.1万字
  • 会员
    本书共有10章,包括51个实操案例解析和80个行业案例分析。书中内容从技能线和案例线展开介绍。技能线:从人工智能的相关技术入手,不仅介绍了AI训练师的发展历程和行业动态,还重点讲述了AI训练师的职业技能提升方法。案例线:不仅涵盖了AI领域的各个方面,而且非常注重算法与模型的实际应用,通过分析大量的经典案例,可以让读者更好地掌握AI训练的相关技能。
    谷建阳编著计算机11.6万字