Hadoop与大数据挖掘(第2版)在线阅读
会员

Hadoop与大数据挖掘(第2版)

王哲 张良均等
开会员,本书免费读 >

计算机网络数据库14.7万字

更新时间:2022-08-10 10:02:27 最新章节:11.7 小结

立即阅读
加书架
下载
听书

书籍简介

这是一本讲解如何基于Hadoop技术栈进行大数据挖掘和分析的著作。它能带领你零基础快速掌握Hadoop技术栈,以及基于它的大数据挖掘与分析的流程和方法。全书核心内容分为两部分。1.Hadoop技术栈:详细讲解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大数据技术的基础、原理、应用,通过这部分内容读者能对Hadoop技术栈有从宏观到微观的了解。2.Hadoop大数据挖掘:通过3个综合案例,逐步展示了基于Hadoop的大数据挖掘的完整流程和方法。几位作者在大数据项目研发、教育、咨询等领域有10余年的丰富经验,对教育界和企业界供需两端的了解非常深入,全书的结构和内容围绕这两端的需求尽心设计,能让Hadoop大数据挖掘与分析的教育和学习事半功倍。本书第1版出版后,获得了教育界和企业界的良好反馈,其中数十家高等院校采用本书作为教材或参考书。第2版在第1版的基础上,在技术适应性、案例实用性等方面做了大量更新,与时俱进,更有竞争力!为了便于学习和教学,本书配套数据文件、实现代码、课后习题、教学PPT。
品牌:机械工业出版社
上架时间:2022-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    本书本书基于业务问题,就如何搭建分析框架,厘清分析思路,按照标准分析步骤对数据进行怡当的预处理,选择合适的分析方法和分析模型,使用恰当的分析工具对数据进行分析,以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解,帮助业务专家做出合适的业务判断,制定准确的业务策略。
    傅一行计算机13万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。
    袁昕编著计算机8.5万字
  • 会员
    本书是Python数据分析与挖掘领域的公认的事实标准,前两版销售超过15万册,被国内100余所院校采用为教材,同时也被广大数据科学工作者奉为经典。本书以真实项目案例为驱动,以真实的行业应用为依托,帮助读者快速掌握数据分析与挖掘的相关技术、流程与方法。本书精选了7个经典实战案例,涵盖了房地产、零售、互联网等多个领域,将Python编程知识、数据分析与挖掘知识和行业知识融合,让读者在实践中快速地掌握针
    张春福 白婧 张良均 范林元 吴建平计算机14万字
  • 会员
    《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
    刘伟计算机0字
  • 会员
    本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL
    王雪松 张良均主编计算机8.1万字
  • 会员
    本书共8章,第1章介绍新媒体数据分析的基础知识;第2章介绍各种新媒体数据分析指标;第3章介绍新媒体数据的采集;第4章介绍新媒体数据处理;第5章介绍新媒体数据分析的思维和方法;第6章介绍新媒体数据可视化;第7章介绍不同新媒体平台的数据分析方法和实战技能;第8章介绍新媒体数据分析报告的制作。
    赵春红计算机9.2万字
  • 会员
    云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同,云计算环境下,信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构,安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型;服务
    林果园计算机9.5万字
  • 会员
    本书围绕新工科背景下大数据人才培养需求编写,既涵盖了大数据的基础知识,又介绍了大数据分析的相关工具与案例。全书共9章,介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程;重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用,还介绍了大数据实验环境的详细搭建步骤,方便读者快速理解和体验大数据应用技术;最后介绍了大数据治理中法律政策、行业标准建设的
    于俊伟 母亚双 闫秋玲编著计算机14.5万字