spark
小迁W️:bjmsb2019
java 大数据 人工智能 架构师学习资料免费分享
展开
-
「资源」每天花5h来学习Hadoop+Spark大数据巨量分析与机器学习实战
本文的主题是Hadoop+Spark大数据分析与机器学习。众所周知,Hadoop是运用最多的大数据平台,然而Spark 异军突起,与Hadoop兼容而且运行速度更快,各大公司也开始加入Spark的开发。例如,IBM公司加入Apache Spark社区,打算培育百万名数据科学家。谷歌(Google)公司与微软公司也分别应用了Spark的功能来构建服务、发展大数据分析云与机器学习平台。这些大公司的加...原创 2020-03-07 18:02:15 · 811 阅读 · 1 评论 -
以源码为基础,结实际案例,深入分析Spark核心原理和生态圈BDAS
前言:图解Spark:核心技术与案例实战以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark 生态圈相关组件,包括了Spark SQL 的即席查询、Spark Streaming 的实时流...原创 2020-02-24 17:11:47 · 475 阅读 · 0 评论 -
五年经验大佬带你掌握 基于Hadoop与Spark的大数据开发实战
前言:本书以Hadoop和Spark为核心,阐述了基于这两种通用大数据处理平台的应用开发技术。在Hadoop生态圈中,从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时,介绍了几种离线处理系统中常...原创 2020-02-20 15:51:58 · 775 阅读 · 0 评论