大数据学习笔记(自用)
文章平均质量分 68
放下华子我只抽RuiKe5
代码如诗,逻辑如词,用指尖编制世界的模样。
展开
-
大数据分布式:数据导论、大数据诞生(分布式处理技术)、大数据概述(特征)、大数据软件生态(技术框架及负责场景)、Apache Hadoop概述(框架、Hadoop的功能、发展、发行版本)
大数据的出现,本质上是为了解决海量数据的处理难题。使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值。【狭义的、技术思维的】而广义的是数字化时代。狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系。广义上:大数据是数字化时代、信息化时代的基础(技术)支撑,以数据为生活赋能。Hadoop是Apache软件基金会下的顶级开源项目,用以提供:•分布式数据存储•分布式数据计算•分布式资源调度为一体的整体解决方案。原创 2023-05-06 19:21:38 · 729 阅读 · 0 评论 -
《黑马程序员2023新版黑马程序员大数据入门到实战教程,大数据开发必会的Hadoop、Hive,云平台实战项目》学习笔记总目录
前言:配置三台虚拟机,为集群做准备(该篇章请到原视频进行观看,不在文章内详细展开)本文是对《黑马程序员新版大数据入门到实战教程》所有知识点的笔记进行总结分类。学习时总结的学习笔记以及思维导图会在后续更新,请敬请期待。3.配置了三台服务器之间root用户的SSH免密互通。2.在Linux系统以及本机系统中配置了主机名映射。1.设置三台Linux虚拟机的主机名和固定IP。5.关闭了防火墙和SELinux。4.安装配置完成了JDK环境。6.更新了时区和同步了时间。第一章:大数据&分布式。7.拍摄快照保存状态。原创 2023-05-06 11:19:16 · 2699 阅读 · 0 评论