大数据big data指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新
处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大量数据资源为解决以前不可能解决的问题带来了可能性。
1大数据不一定存储于固定的数据库,而是分布在不同的网络空间
2大数据以半结构化或非结构化数据为主,具有较高的复杂性
3大数据注重的是全量样本数据而不是局部数据,注重相关性而不是因果关系,通过分析和数据挖掘将其转化为知识,再由知识提炼成智慧以获取洞察。
大数据的4个特点,数据量大Volume、数据类型繁多Variety、速度快Velocity和价值密度低Value
大数据技术是发现大规模数据中的规律,通过对数据的分析、发现,从而实现对决策层决策提供支持,实现商业价值,所以大数据发展的最终目标还是挖掘其应用价值,没有价值或者没有发现其价值的大数据从某种意义上讲是一种冗余和负担。
1存储设备容量不断增加
单位存储空间价格不断降低,开始倾向于将更多的数据保存下来
数据量单位:字节B KB MB兆 GB吉 TB太 PB拍 EB艾 ZB泽
2CPU处理能力大幅提升
摩尔定律:CPU性能大约每隔18个月提高一倍,价格下降一半