第一章 大数据概论
1.1、大数据概念
按顺序给出数据存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB
1Byte=8bit 1K=1024Byte 1MB=1024K
1G=1024M 1T=1024G 1P=1024T
1.2、大数据特点
1、Volume(大量)
2、Velocity(高速)
这是大数据区分于传统数据挖掘的最显著特征。根据IDC “数字宇宙” 的报告,预计到2020年,全球数据使用量将达到35.2ZB。 在如此海量的数据面前,处理数据的效率就是企业的声命
3、Variety(多样)
这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据,非结 构化库数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
4、Value(低价值密度)
价值密度的高低与数据总量的大小成正比。如何快速对有价值数据 “提纯” 成为目前大数据背景下待解决的难题
1.3、大数据应用场景
1.物流仓储:大数据分析系统助力商家精细化运营、提升销量、节约成本
2.零售:分析用户消费习惯,为用户购买商品提供方便,从而提升商品销量
3.旅游:深度结合大数据能力与旅游行业需求,共建旅游产业智慧管理、智慧服务和营销的未来
4.人工智能:
1.4、大数据发展场景
1.党的十八大提出 “实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场 需求处于爆发期,我国大数据产业面临重要的发展机遇。
2.党的十九大提出 “推动互联网、大数据、人工智能和实体经济深度融合”。
3.国际公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。
4.2017年北京大学、中国人民大学、北京邮电大学等25所高校成功申请开设大数据课程。
5.大数据属于高新技术,大牛少,升职竞争小
6.在北京大数据开发工程师的平均薪水已经到24060元,而且目前还保持强劲的发展势头
1.5、大数据部门业务流程分析
产品人员提需求(统计总用户数、日活跃用户数、回流用户数等)
数据部门搭建数据平台、分析数据指标
数据可视化(报表展示、邮件发送、大屏幕展示等)