在信息科技高速发展的背景之下,海量数据已经让拥有者和管理者应接不暇,根据IDC发布的《数据时代2025》预测,全球数据圈(数据圈代表每年被创建、采集或是复制的数据集合)将从2018 年的32ZB增至2025年的175ZB。2018年,中国数据圈为7.6ZB,占全球的23.4%,预计2025年中国数据圈将增至48.6ZB,占全球27.8%,成为全球最大的数据圈。
海量数据是有“温度”的,按照被访问频率从高到低进行分类,可以将数据为热数据、温数据、冷数据。经常被访问的称为热数据,较少被访问的数据称为冷数据,处于中间状态的称为温数据。
热数据
热数据需要被计算节点频繁访问的在线类数据。
热数据因为访问频次需求大,效率要求高,所以就近计算和部署,数据缓存、在线存储、近线备份,以实现数据快速访问及高速处理。
温数据
温数据是非即时的状态和行为数据。如果整体数据量不大,也可以不区分温数据和热数据。
冷数据
一般很少变化的、长时间固定的数据或者属性,如:
· 过时的项目
· 日常记录和维护的数据
· 有关法律政策的