深度强化学习实践(原书第2版)在线阅读
会员

深度强化学习实践(原书第2版)

(俄)马克西姆·拉潘
开会员,本书免费读 >

计算机网络人工智能29万字

更新时间:2021-08-18 17:40:31 最新章节:25.7 总结

立即阅读
加书架
下载
听书

书籍简介

本书的主题是强化学习(ReinforcementLearning,RL),它是机器学习(MachineLearning,ML)的一个分支,强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩游戏到优化复杂制造过程都能涵盖。
品牌:机械工业出版社
译者:林然 王薇
上架时间:2021-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(俄)马克西姆·拉潘
主页

同类热门书

最新上架

  • 会员
    本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。
    关东升计算机8.8万字
  • 会员
    本书共14章,主要内容包括探索性数据分析、有监督学习(线性回归、SVM、决策树等)、无监督学习(降维、聚类等),以及深度学习的基础原理和应用等。
    段小手计算机18万字
  • 会员
    本书讲解如何利用AI工具来高效制作和设计PPT,全书共分为8章,前面7章分别介绍了PPT不同制作内容的相关知识和技巧,包括软件操作层面、设计思维层面、素材应用层面的内容,第8章模拟了两个真实工作场景下的PPT使用需求,逐步讲解设计的关键环节,旨在帮助读者解决工作中的实际问题。
    凤凰高新教育编著计算机601字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行
    郭秉义计算机18.3万字
  • 会员
    本书共八章,从高校资源配置的教育、科研、社会、经济规律视角,以建设卓越世界一流大学为导向,对高校科学仪器设备配置中的问题进行研究。
    王士国 翟宇 虞振飞 方良华计算机17.5万字
  • 当前世界正处于百年变局,人类社会已经进入数字经济3.0时代:数字内容迭代,从1.0时代逐步迈入3.0时代;人工智能技术飞跃,从符号推理、深度学习走向知识+数据驱动的3.0时代;产业拓展更深更广,走向智能+3.0时代。随着大模型、ChatGPT、DeepSeek等智能涌现,我们该如何触发AI时代其他的突破性技术涌现?这些技术又该怎样反哺产业升级?本书阐述了人工智能技术演变的大趋势、算力驱动计算体系的
    张亚勤计算机13.1万字
  • 会员
    近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang
    徐双双编著计算机12.7万字
  • 会员
    我们在运用AI的时候,有时得不到自己想要的回答,于是责怪AI不够智能。我们容易忽略的是,AI的回答质量往往取决于提问的质量。《秒懂AI提问:让人工智能成为你的效率神器》系统地介绍了20种向AI提问的有效方法,用这些方法可以让AI给出高质量的回答。在介绍提问方法时,本书紧扣日常工作和生活,并通过对比让读者直观感受不同提问方法的效果,最后引出更多场景下的应用,让读者真正学以致用。《秒懂AI提问:让人工
    秋叶 刘进新 姜梅 定秋枫计算机5.4万字