大数据导论
1.大数据的概念
大数据:bigdata,无法用常规软件处理的数据集合,需要一种新的模式去处理,这就是大数据
大数据解决得问题(作用):海量数据的存储,海量数据的运算,海量数据的迁移
大数据应用场景:数据化时代,大数据人工智能,为生活赋能(各行各业)
2.数据的单位
3.大数据的特点
大:数据体量大
多:数据种类和来源多
值:低价值密度
快:增长速度快,处理速度快,获取速度快
信:结果准确,可以信赖的
4.大数据的分析步骤
明确分析的思路→数据收集→数据处理→数据分析→数据可视化→撰写报告
5.大数据学习路线
python基础
mysql数据库
linux操作系统
hadoop&hive&zookeeper等技术栈
项目一
项目二
python高级
spark等技术栈
项目三
项目四
项目五
java基础
flink等技术栈
项目六
大数据学习相关软件
计算机组成
计算机组成: 硬件和软件
硬件: 冯诺依曼体系结构(输入设备,输出设备,运算器,控制器,内外存储器)
软件: 系统软件和应用软件
系统软件作用: 承上启下: 硬件和应用软件的桥梁
编程语言
编程语言: 人和计算机交互一种语言
编程语言历史: 低级语言 -> 高级语言 -> 面向对象时代(java和python)
注意: sql是一种特殊的编程语言