更多企业数据将进入数据湖,来自传统系统的数据和传感器等新型数据资源不断融合,数据孤岛将继续被打破。
随着大数据分析能力的不断提高,人工智能的重要性被逐步提升。当今最先进的机器学习和人工智能系统正在超越传统的基于规则的算法,创建出能够理解、学习、预测、适应,甚至可以自主操作的系统。
企业现在正处于大数据的“焦虑期”
1、存储成本问题:海量数据需要在多环境、多级下重复存储,存储开销大
2、数据形态问题:应用大多聚焦在经过加工后的再生数据,原始数据无法得到充分利用
3、业务响应问题:必须事先进行充分规划和较长周期加工,欠缺运营所需的灵活性和时效性
数据湖的能力视图
多样化的数据存储;高效的数据处理;存储全部数据;处理任何数据;访问任何数据
数据湖并非是个全新概念
1.“数据湖”是关于企业应用大数据的概念,是面向企业的最佳的大数据的解决方案
2.“数据湖”不仅是数据存储和处理的单元,也是释放数据价值的过程
3.企业大数据应用成功的关键并不是存储所有的数据,而是要创建一个更有意义的“数据湖”,帮助企业加速提取高价值数据的速度