大数据课程排序表

最新推荐文章于 2024-06-29 19:59:33 发布

冇得一篇好文章

最新推荐文章于 2024-06-29 19:59:33 发布

阅读量96

点赞数

文章标签： big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41057009/article/details/120522675

版权

第一阶段

Linux

day.1

Linux系统概念
Linux系统安装
安装CentOS系统
CentOS系统初始化
硬盘、常见命令
常见命令的炒作演示
运行级别

day.2

用户的管理
权限
磁盘与文件系统
网络

day.3

passwd
虚拟机的连接模式
远程管理
网络配置
免密登录
进程
系统资源监控

day.4

任务管理
vim命令
压缩、打包
rpm
yum

day.5

yum、防火墙和shel基础
shell基础
shell命令
shell命令-sed
shell命令-sort
shell脚本

day.6

shell脚本参数
shell脚本判断语句
shel脚本循环语句
Linux知识点总结

BIGDATABASE

day.1

BIO/NIO(buffer)
NIO(channel)
NIO(selector)
Concurrent概述
Concurrent阻塞式排队
CAS无锁算法、红黑树

day.2

红黑树
并发导航映射、ExcutorService执行器服务
线程池
Callable线程机制
分叉合并池
锁

day.3

原子型操作、zookeeper概述
zookeeper单机安装、操作
zookeeper基础概述
zookeeperAPI操作
zookeeper集群安装配置
zookeeper选举

day.4

ZAB协议、原子广播
ZAB协议-奔溃恢复、观察者
观察者的配置、配置信息
VARO
数据序列化、反序列化、RPC
大数据概念

第二阶段

HADOOP

day.1

Hadoop概述
Hadoop应用
Hadoop伪分布安装
HDFS概述、block
HDFS-NameNode
HDFS-副本放置策略

day.2

HDFS其他细节
dfs目录
HDFS流程
HDFS的API操作
MapReduce简介
MapReduce的API操作

day.3

MapReduce序列化机制
MapReduce分区

day.4

MapReduce数据本地化
MapReduce的执行流程
Shuffle
Shuffle调优
小文件处理

day.5

hadoop集群安装配置
Hadoop版本的对比讲解
自定义输入格式API
数据倾斜
Yarn概述

第三阶段

FLUME

day.1

flume安装
flume的source练习
flume自定义source
flume的channel、sink
flume的sink练习

HIVE

day.1

flume的扇出流动、Selector、Interceptor
flume的interceptor、processhive概述
数据库和数据仓库的区别、hive的安装
hive基础指令
Linux下的MySQL安装、配置
hive的外部表和分区表

day.2

hie分桶表
hive数据类型、连接查询、内置函数
hive自定义函数UDF
hive的JDBC及优化
hive数据倾斜及其他hive优化
Sqoop概述、安装及指令
hive实现Zebra

HBASE&PHOENIX

day.1

HBASE概述
HBASE的单机安装
HBASE的基本概念及指令
HBASE的API
HBASE的api及数据库、数据仓库区别
HBASE物理存储原理

day.2

HBASE基本原理
HBASE架构
HBASE架构原理详情
HBASE写流程
HBASE读流程
HBASE表设计及优化
Phoenix介绍

第四阶段
KAFKA
day.1

kafka简介
kafka安装、概念介绍
kafka概念介绍、架构
kafka的使用
kafka消息系统语句、串讲

SCALA
day.1

Scala简介
Scala基本语法
Scala函数

day.2

Scala集合-Array
Scala集合-List、Set、Map
Scala-Tuple（元祖）
Scala高阶函数练习、Scala类

SPARK
day.1

Spark介绍
Spark单机模式安装、RDD介绍
RDD操作
Spark的DAG概念
Spark框架核心概念、Spark代码端

day.2

Spark练习
Spark集群安装
Spark集群架构、调度模块
Spark Shuffle详解
Spark缓存级别

day.3

Spark调优
GC回收机制及算法、收集器
GC配置、Spark Checkpoin机制
数据倾斜问题及解决办法
Spark共享变量、组件源码解读

day.4

机器学习-SparkMLib介绍
Spark Mllib的基本数据类型
欧式距离、最小二乘法
预测商品需求量

day.5

梯度下降法
Sigmoid函数
逻辑回归案例
协同过滤
商品推售
电影推售

day.6

ALS算法
推荐系统的冷启动问题
贝叶斯定理
Spark Sql概述、基本语法
Spark Sql的API
SparkStream介绍

第五阶段

WEBANALYPROGECT

day.1

实现历史批次累加-spark
SparkStreaming和kafka整合
网站流量指标介绍
网站流量分析-搭建日志服务器
日志服务器的搭建以及flume整合
将flume数据存到HDFS、整合hive

day.2

网站流量指标处理-hive
hive的占位符与文件的作用
Sqoop将HDFS结果问价导出到MySql
实时系统搭建
spqrk与HBASE整合
大数据知识点串讲

day.3

将指标数据插入HBASE表
查询HBASE表中数据计算指标值
大数据串讲及生产环境

STORM

day.1

Storm概述
Storm入门案例
Storm并发控制&数据流分组方式
Storm可靠性保障
Storm集群安装配置

第六阶段

PYTHON

day.1

可视化概述、Echarts入门
个性化图标样式
动态加载数据
网站流量可视化
Python概述、安装

day.2

Python基本语法
Python重要API-集合类
Python语法-函数、模块、、包
Python重要API-IO、异常机制
Python语法-面向对象
爬虫概述

day.3

Python爬虫框架
Python爬虫框架使用
Python电影
Python电影、TTS大数据项目业务景
TTS大数据项目需求分析
TTS大数据项目架构设计、数据格式

day.4

Freemarker-数据模板
生产测试数据
hive中存储json格式数据
在hive种进行数据处理
将数据导出到关系数据库中
数据仓库维度建模

day.5

SpringData概述
SpringData的JPA使用
SpringDataHadoop-Hive
开发SpringData调度程序

MACHINELEARNING

day.1

机器学习概述及应用
R语言
统计学基础
随机变量及其分布

day.2

R画圆基础
协议差和相关系数
求职者案例说明
矩阵估计

day.3

最小二乘法
一元线性回归
多元线性回归
逐步回归+多重共线性
岭回归原理

day.4

岭回归原理
LASSO回归
LAR算法
逻辑回归
数据处理技术
主成分分析

day-5

距离度量和相似度量
系统聚类
K-Means聚类
RMF客户价值识别
线性判断别
KNN判断
贝叶斯定理
朴素贝叶斯分类器
贝叶斯网格

day.6

决策树+ID3算法树
cart算法
决策树案例
bagging算法
特征空间与核函数
SVM算法

冇得一篇好文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据课程排序表

Linuxday.1Linux系统概念Linux系统安装安装CentOS系统CentOS系统初始化硬盘、常见命令常见命令的炒作演示运行级别day.2用户的管理权限磁盘与文件系统网络day.3passwd虚拟机的连接模式远程管理网络配置免密登录进程系统资源监控day.4任务管理vim命令压缩、打包rpmyumday.5yum、防火墙和shel基础shell基础shell命令shell命令-sedshell命令-sortshe
复制链接

扫一扫

冇得一篇好文章 CSDN认证博客专家 CSDN认证企业博客

码龄7年

13: 原创

107万+: 周排名

20万+: 总排名

1万+: 访问

: 等级

159: 积分

17: 粉丝

21: 获赞

5: 评论

49: 收藏

私信

关注

热门文章

最新评论

Bootstrap Table
CSDN-Ada助手: 恭喜您写了第13篇博客！很高兴看到您对Bootstrap Table有深入的了解，并且能够分享给大家。接下来，我建议您可以考虑写一些实际使用案例，或者是与其他前端框架的对比分析，这样可以让读者更加深入地了解Bootstrap Table的优势和不足之处。期待您的下一篇作品！
EasyUI Tree 树
CSDN-Ada助手: 恭喜您写了第14篇博客，标题为“EasyUI Tree 树”！您的持续创作让我们得以学习到更多有用的知识，非常感谢您的分享。希望您能继续保持创作的热情，不断探索更多有趣的主题。或许下一步可以考虑分享一些实际应用的案例，让读者更好地理解和运用EasyUI Tree。期待您更多的精彩内容！
listagg单组分组查询整组拼接字段
CSDN-Ada助手: 恭喜您写了第12篇博客！标题“listagg单组分组查询整组拼接字段”非常吸引人，让我对内容充满了期待。您的文章一直以来都给读者带来了很多有用的知识和技巧，真的非常感谢您的持续创作。在下一步的创作中，我建议您可以考虑分享一些实际案例，通过实际应用来展示listagg单组分组查询整组拼接字段的优势和用法。这样读者可以更好地理解并应用到实际工作中。同时，如果您能提供一些注意事项或者常见问题的解答，那将更加完善您的文章。无论如何，我相信您在写作方面的才华会继续闪耀，期待看到更多精彩的博客！
DIV写成Textarea文本域
My灬Word: 删除键不好用呢
DIV写成Textarea文本域
water___Wang: 挺好的，加油~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。