ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    本书是全面介绍DeepSeek人工智能平台及其应用的实用指南,旨在帮助读者从零基础开始,逐步掌握DeepSeek的各项功能,并最终达到精通水平,能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者,还是希望进一步提升技能的专业人士,本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章,涵盖了DeepSeek的各个方面,从基础入门到高级应用,再到私有化部署,
    乔剑 苏小文计算机15.6万字
  • 会员
    本书以“人工智能(ArtificialIntelligence,AI)+”为主题,探讨了AI如何赋能千行百业,促进各类先进生产要素向发展新质生产力集聚。本书共7章,主要介绍了新质生产力之问,AI之问,AI顾问实践:人类的“辅导员”,AI助手实践:人类的“副驾驶”,智能体实践:人类的“AI代理人”,用尺度定律推演未来,新质生产关系与AI伦理观等内容。本书基于国内多行业、多领域应用“AI+”已取得明
    田丰计算机13.7万字
  • 会员
    本书是一本专为企业管理者和办公人员打造的实用指南,旨在帮助企业通过人工智能技术实现数字化转型,提升运营效率与竞争力。结合丰富的企业AI解决方案设计与实施经验,深入剖析了DeepSeek这一领先的人工智能模型在企业中的广泛应用场景。全书共分为四大部分,涵盖了企业管理、市场营销、销售与客服等多个核心领域,详细介绍了近100个企业使用场景,展示了如何通过DeepSeek实现效率的百倍提升。无论是人力资源
    苏江 温洁计算机8.7万字
  • 会员
    本书旨在帮助读者从零开始学习人工智能,掌握人工智能的原理、技术和应用。本书共10章,首先是人工智能概述,接着深入浅出地讲解人工智能的原理和技术,包括数据预处理、数据可视化、机器学习基础、监督学习模型、无监督学习算法、神经网络基础、训练深度神经网络等内容,最后讲解人工智能的应用,包括智能对话和知识图谱。本书适合想要学习并掌握人工智能技术和应用的零基础读者阅读,还可以作为高等院校人工智能相关课程的教材
    李烨 韩慧昌 侯鸿志 潘旺计算机11.3万字
  • 会员
    DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化
    李强编著计算机3.6万字
  • 会员
    从电台、电视、互网联到人工智能,每一次技术迭代总能为营销带来广泛的机会,并促使营销自身产生翻天覆地的变化。作为新技术的代表,生成式AI正以其强大的功能和广泛的应用场景,塑造着人们对于未来的憧憬。其对于世界的影响越巨大,对于营销范式的重塑会越深刻。本书基于技术和营销的关系,阐述了生成式AI技术条件下营销演变的底层逻辑,并进一步明确了未来的营销新趋势。通过深入分析生成式AI的洞察、创意和媒介能力,本书
    谭北平 金立印计算机12.8万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 会员
    本书全面解析了DeepSeek的崛起历程、技术突破及其对AI行业的深远影响。全书共6章,第1章追溯DeepSeek的起源与发展,展示其从初创到全球爆火的历程;第2章通过“AI领域拼多多”的比喻,分析其低成本、高性能的商业化路径,并深入探讨其核心技术;第3章介绍相关应用方法,包括优化交互方式、调用API服务、本地部署模型等;第4章、第5章分别分析DeepSeek引发的行业变革,以及其AI能力在垂直行
    陈根计算机11.6万字
  • 会员
    优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。
    梁成睿计算机8.5万字