1. 大数据
大数据是指在传统数据处理应用软件不足以处理的大或复杂的数据集。
例如: TB、PB、EB、…
2. 大数据解决的问题
大量数据的存储和计算。
3. 大数据的特点 :(4V)
① Volume(大量)
数据量大。
② Velocity (高速)
数据量的增长速度快。
③ Variety (多样)
传统的数据以结构化数据为主。
大数据的数据有结构化的数据和非结构化的数据,其中非结构化的数据越来越多(如网络日志、音视频、图片等)。
④ Value (低价值密度)
数据的价值密度与数据量成反比。
4. 大数据的生态主要包括 Hadoop生态和spark生态