本发明涉及数据处理技术领域,尤其涉及一种区分热数据和冷数据的方法。
背景技术:
目前有很多方法区分热/冷数据,但是都需要用很大的表来记录LBA点击的次数,设备尺寸越大,需要的表也就越大;有些则是不够精确,譬如只参考删除次数来决定是否为冷数据。
技术实现要素:
基于背景技术存在的技术问题,本发明提出了一种区分热数据和冷数据的方法,本方法提出如何用少量的RAM,搭配一些权重机制来有效地区分热/冷数据,在主机写入的当下就可以精确预测是否为热/冷数据。
本发明采用的技术方案是:
区分热数据和冷数据的方法,其特征在于,包括以下步骤:
(1)将设备分为N份数据,编号为0~N-1,用队列进行管理这些数据,队列的长度为L,1≤L≤N,队列中每个节点记录一份数据的点击次数;
(2)每次刷新数据时,其中第i份数据被点击到,就把第i份数据放到队列的第一个位置;
(3)一段时间之后,取队列中前M个数据的点击次数与计数阈值作比较,点击次数大于计数阈值的节点作为热数据,否则作为冷数据。
本发明的原理是:
本发明将设备分为N份数据,每份数据涵盖一个LBA范围,若主机写入的LBA在队列