海量非结构化数据已经到来
随着数据的海量增长和潜在价值的不断提升,数据已经成为最重要的资产,各行各业都释放出海量数据。据Gartner估计,从2019年到2024年,非结构化数据容量预计将增加两倍。然而作为“庞然大物“,却成为企业存储中“隐秘的角落”。尽管企业花费了大量成本长期存放这些数据,也未必能够带来满意的附加价值,而管理不当,则会令企业蒙受相当大的损失。这可以说与企业在大数据时代的追求背道而驰,是所谓“数据价值”背后隐秘的幽暗。
非结构化数据为什么难管理?
和结构化数据相比,非结构化的数据最本质的区别包括三个方面:
1. 非结构化数据的容量比结构化数据更大;
2. 产生的速度比结构化数据更快;
3. 数据来源更具有多样性。
由于非结构化数据的“大且乱”的特点,所以管理非结构化数据也随之迎来了挑战:
1.数据体量大、成本高
企业级的数据大多都是PB、EB量级,文件数