强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页

最新上架

  • 会员
    本书讲解了C++语言基础知识,以及编程解题常用的方法和基础算法。每章都是由一个小故事来引出编程思维。本书也介绍了各种有趣的计算机知识,并涵盖了全国青少年软件编程等级考试(C语言)一级和二级考试的知识点。
    王桂平 周祖松 穆云波 葛昌威编著计算机13.4万字
  • 会员
    本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。
    王振丽编著计算机11.2万字
  • 会员
    本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超
    聂常红编著计算机13.2万字
  • 会员
    Node.js是一个基于ChromeV8引擎的JavaScript运行环境,用来编写服务器端程序。Node.js是新兴的开发工具,也是目前发展较快的开发工具之一。近几年来,随着Node.js的发展,越来越多的开发人员选择用它构建Web应用。本书较为系统地介绍了目前Node.js应用开发中涉及的基础知识和核心技术,并通过案例介绍了基于Express和Koa框架的项目开发。本书着重实际应用,案例及实
    唐小燕 刘洪武主编计算机10.9万字
  • 会员
    本书是Java入门书籍,适合初学者使用。全书共13章,第1章主要讲解Java的特点与发展史、JDK的使用、Java程序的编写与运行机制、Java开发环境的搭建等;第2~6章主要讲解Java编程基础知识,包括Java基本语法、面向对象、JavaAPI和集合;第7~12章主要讲解Java进阶知识,包括I/O、多线程、网络编程、JDBC、GUI、Java反射机制;第13章带领读者开发一个综合项目——基
    黑马程序员编著计算机20万字
  • 会员
    本书系统地阐述了区块链技术的理论体系结构,辅以典型工程案例,为读者展示成熟的分析方法和解决方案。全书内容包括区块链概述、区块链开发基础、区块链核心技术解析、区块链数据存储、区块链网络构建、以太坊技术解析、区块链技术改进、区块链安全性分析、区块链项目实战案例。本书难易适中,内容充实,层次清晰,可作为普通高等学校信息安全、网络空间安全、软件工程、计算机科学与技术等专业本科生和研究生教材,也可以作为区块
    王瑞锦主编计算机18.8万字
  • 会员
    本书是魏永明近30年来开发和维护MiniGUI、HVML等开源项目的经验总结,旨在帮助有一定C程序编写经验的软件工程师在短时间内有效提高设计能力和编码水平。全书分为?3?篇。基础篇从可读性和可维护性出发,阐述了如何提高代码的可读性、用好写好头文件、正确理解编译警告并消除潜在问题、定义和使用常量等,介绍了如何有效利用构建系统生成器(CMake)来维护项目;模式篇阐述了常见的C程序接口设计模式,说明了
    魏永明计算机19.6万字
  • 会员
    本书主要探讨高并发场景下系统设计的原理和实践案例,帮助读者系统、快速地理解高并发系统的设计原理与相关实践,以及掌握解决高并发场景下可能遇到的各种问题的方法。本书共6章。第1章介绍高并发系统的发展历史、设计难点和基本设计原则,以及度量指标;第2~4章介绍有助于提升高并发系统可用性的3种方法—系统容错、冗余和分片;第5章从提升高并发系统性能的角度讲解并发与异步的原理和实践技巧;第6章从系统运维和团队流
    唐扬计算机11.4万字
  • 会员
    本书共有10章内容,以认识Unity引擎开始,从0到1突破,介绍了Unity游戏开发的方方面面。
    房毅成编著计算机0字