- 什么是大数据 :指无法或无法在一定时间内用常规的软件进行采集、存储、处理(分析计算) 的数据集合,是需要新处理模式才能处理的海量、高增长率、多样和低价值密度的信息资产。
- 特点
- 海量:一般为TB、PB、EB、ZB的数据量级。【要求存储数据的服务器越来越多】
- 高增长率:数据量增长的越来越快。【要求处理数据的速度也要越来越快】
- 多样化:有结构化数据、非结构化数据。【要求不管是什么样的数据都能够采集、存储、处理】
- 低价值密度:真正有用的数据占比很小。【要求对数据清洗,去掉无用的信息,提高价值密度】
- 应用场景
- 抖音:推荐的都是你可能喜欢的产品
- 电商网站中广告推荐:推荐的都是你可能喜欢的产品
- 物流:哪个位置的仓库存哪类商品,车跑哪里跑几趟是最优的—>降低成本且物流快
- 保险、金融、人工智能、5G、虚拟现实、无人驾驶等
- 部门间业务流程:
- 大数据部门的结构:
【Hadoop---01】什么是大数据?
于 2022-09-17 20:35:42 首次发布