既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
-
第一章 Hadoop大数据开发环境
-
Hadoop概述
-
在VirtualBox上安装虚拟机
-
Hadoop安装前的准备工作
-
第一次作业
-
简述大数据包括的主要内容
- 大数据技术指用于处理大规模、高速增长、多样化数据的一系列工具和技术。
- 包括数据采集与存储、数据处理与分析、数据计算、数据可视化、数据安全、知识图谱、数据挖掘等方面。
- 帮助组织从海量数据中获取有用数据。
-
简述大数据的基本特征
-
巨量性
- 随着信息技术的高速发展,数据爆发性增长。
-
多样性
- 数据类型繁多。数据分为结构化数据、半结构化数据和非结构化数据。
-
高速型
- 处理速度快。
-
准确性
-
价值密度低,商业价值高。
- “大海捞金”
-
-
简述Hadoop及其优势
-
简述Linux命令的功能
-
sudo
- 以超级用户的权限执行命令
-
cd
- 切换目录
-
mv
- 移动或重命名文件
-
chown
- 修改文件或目录的所有权和所属组
-
ls
- 列出目录下的文件和子目录
-
mkdir
- 创建新文件夹
-
cp
- 复制文件或目录
-
cat
- 查看文件内容
-
gedit
- 打开文本编辑器(比vim更方便)
-
whoami
- 显示当前登录用户的用户名
-
df
- 显示磁盘空间使用情况
-
ping
-
-
-
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**