Hadoop学习笔记(一)
大数据概论
大数据(Big Data):指无法在一定时间范围内用常用的软件工具进行捕捉、管理和处理的数据的集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
主要解决,海量数据的存储和海量数据的分析计算问题。
数据的存储单位:
bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
1 Byte = 8 bit ;1 K = 1024 Byte ;1 MB = 1024K
1 G = 1024 M ;1 T = 1024 GB ;1 P = 1024 T;
大数据的特点(4V)
1、Volume(大量)
2、Velocity(高速)
3、Variety(多样)
4、Value(低价值密度)
大数据的应用场景
1、物流仓储
2、零售
3、风控系统
4、用户画像
5、人工智能....