- 大数据在维基百科上定义为:无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
- 在Gartner将大数据定义为:在一个或多个维度上超出传统信息技术的能力的极端信息管理和处理问题。
- 大数据环境下,数据来源非常丰富且数据类型多样,存储和分析挖掘的数据量庞大,对数据展现的要求较高,并且很看重数据处理的高效性和可用性,需要依靠并行计算提升数据处理速度。
- 数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中、人们事先不知道的,但又是有用的信息和知识的过程。
- 以hadoop为原型的大数据框架称为现在数据分析的主流。
- 大数据关键技术:数据采集中负载均衡和分片至关重要、导入预处理:导入数据量大,每秒数据导入量一般在百兆或者千兆上。
- 统计分析:EMC的GreenPlum、oracle的Exadata、Mysql的列式存储Infobright等。
- 4P理论到4C理论:产品到消费;价格到成本;渠道到便利;促销到沟通等。
- 电信运营商大数据应用:
- 网络管理和优化:基础设施建设优化;网络运营管理和优化;
- 市场与精准营销:客户画像;关系链研究;精准营销;实时营销;个性化推荐。
- 客户关系管理:客服中心优化;客户关怀与生命周期管理。
- 企业运营管理:业务运营监控;经营分析和市场监控。
- 数据商业化:营销洞察和精准广告;大数据检查和决策。
- 主要包括用户画像、关系链识别、精准营销、实时销售和个性化引导。
客服中心优化;客户关怀与客户生命周期管理。
11、数据和竞争优势:
(1)常规报表:发生了什么事?
(2)即席查询:数量、频率、地点如何?
(3)多维分析:问题究竟出自哪里?
(4)警报:需要采取什么行动?
(5)统计分析:为什么会发生?
(6)预报:如果浙西趋势继续下去会如何?
(7)预测性建模:接下来会发生什么事?
(8)可能出现的最好情况是什么?