生态圈:大数据各组件基础搭建、深度学习。

配置大数据组件的总链接:

简单易懂,手把手带小白用VMware虚拟机安装Linux centos7系统

Hadoop集群搭建及配置〇 —— Hadoop组件获取 & 传输文件

Hadoop集群搭建及配置① —— 克隆节点

Hadoop集群搭建及配置② —— 网络IP配置,连接网络

Hadoop集群搭建及配置③ —— 基础环境搭建

Hadoop集群搭建及配置④ —— JDK简介及其安装

Hadoop集群搭建及配置⑤ —— Zookeeper 讲解及安装

Hadoop集群搭建及配置⑥ —— Hadoop组件安装及配置

Hadoop:HDFS的常用命令

Hadoop集群搭建及配置⑦—— Spark&Scala安装配置

Spark HA部署:解决spark单点故障问题

Hadoop集群搭建及配置⑧——Hbase的安装配置



深度学习大数据组件

MySQL:Centos7 网盘安装

Hadoop集群搭建及配置⑨——Hive 可靠的安装配置

Spark.SQL:IDEA 操作 MySQL、Hive

MapReduce 计算框架的执行流程详解

关联 Hive 与 Hbase的数据一致

① Hive 数据管理、内外表、安装模式操作

② Hive:用SQL对数据进行操作,导入数据、清洗脏数据、统计数据订单

③ Hive:多种方式建表,需求操作

④ Hive:分区原因、创建分区、静态分区 、动态分区

⑤ Hive:分桶的简介、原理、应用、创建

⑥ Hive:优化 Reduce,查询过程;判断数据倾斜,MAPJOIN

⑦ Hive:数据进行替换切分后的结果保存为新表,新表进行分词



Scala:实现 wordCount 的算子操作

Spark:Centos7 安装 Anaconda

Spark:spark-shell 处理需求

Spark:SQL操作 cache、filter、selectExpr、agg、join、udf

Spark:运行架构与原理、作业运行模型、RDD、调优 理论介绍

数据的日志采集与用途

Kafka:基础理论知识

Kafka:分布式部署,实践、API连接操作

Spark:Streaming 实时计算框架理论

Spark:Streaming 实践 Dstream 转换算子、窗口、输出文件


Spark SQL RDD基本操作、RDD—DataFrame、API MySQL

Spark SQL RDD、DataFrame、Dataset、反射推断机制 Schema 操作!!


希望有助于大家对大数据有更多的了解!请多多支持哦。

  • 10
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

唐樽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值