1.什么是LRU算法
LRU(Least Recently Used),最近最少使用,是一种内存算法.LRU算法基于一种假设:长期不被使用的数据,在未来被用到的几率也不大.
因此,当数据所占内存达到一定阈值时,要移除掉最近最少使用的数据.LRU算法使用了一种有趣的数据结构,叫做哈希链表.
为什么需要用LRU算法?
这个源于内存资源的稀缺性,它是有上限的,不能将所有资源都放在内存中.
LRU算法中需要注意的点:
1.内存满了的时候,如果再插入数据,就要将其淘汰;
2.每一次访问一个数据,要将其放在容器头部(最安全),需要淘汰的数据放在容器尾部(最危险).
链接学习LFU
2.什么是哈希链表
在现在的内核实现中,我们的文件的Inode底层的存储结构就是哈希链表.
比如说我们现在有文件的文件名和Inode分别是:
/home/muten/C/0021-fs/aaaa 54156446
/home/muten/C/0021-fs/bbbb 54156447
/home/muten/C/0021-fs/cccc 54156448
/home/muten/C/0021-fs/dddd 54156449
/home/muten/C/0021-fs/eeee 54156450
/home/muten/C/0021-fs/ffff 54156451
其中可以将这些值放在散列表中,可以通过建立映射关系,将它们存储起来.
但是内核中不仅仅对Inode和文件名进行了映射,而且还将这些由键和值
组合起来的节点作为双向链表中的一个节点,让它们串起来,这样就形成了
哈希链表结构.原本无序杂乱的哈希表变成按照一定顺序排列的哈希链表.
哈希 --让我们可以通过key值快速找到对应节点的位置,O(1);
双向链表--让我们的插入和删除速率极高,
靠近表头的数据是最近使用数据(使用频率高的数据),
靠近表位的是最近未使用数据(使用频率低的数据),
会依据值的使用频率的高低把我们的元素做一个排列.
3. LRU算法中有两个操作
get方法和put方法.
get方法表示获取某一个数据,如果这个数据不在表头,将数据移到表头;
put方法表示存放某一个数据,存放数据会将数据放在表头的位置.
以第二节中的图为例说明get和put的用法:
get方法有三种情况:
(1)数据不存在,一般get是根据key值来找它的数据,如果通过hash找不到这个值,可以通过
返回一个规定的值告知这个值不存在.
(2)数据存在且数据在表头,只要获取数据即可.
比如说找key1对应的val1,先从hash表中把key1对应的实际节点
的起始位置找到,这样可以快速定位到key1所对应的数据实际存放的节点位置,这时可以
直接返回这个节点中的val1;
(3)数据存在且数据不在表头,除了需要获取数据之外还要将数据移动到表头.
如找key3对应的val3,先从hash表中把key3对应的实际节点的
起始位置找到,这样可以快速定位到key3所对应的数据实际存放的节点位置,这时可以直
接返回这个节点中的val3,从下图可看出key3并不在表头位置,此时需要做一个移动的操作,
会把key3|val3这个节点移动到我们这个表头的位置.它一般是把这个地方的链接关系清
除掉(对于key3|val3这个节点移动就是先把key3|val3清除掉,删掉key2|val2与key3|val3
之间以及key3|val3与key4|val4的连接,然后让key2|val2与key4|val4连起来),再将这个
节点放在表头的位置(对于key3|val3这个节点就是把key3|val3这个节点放到表头的位置).
put方法:
put方法分以下两种情况:
(1)这个数据不存在,如找key5,key5不存在.首先需要建立一个key5及其节点指针之间的kv映射,
之后还需要建立一个新的数据的节点key5|val5,并将其放到表头的位置的下一位.
我们可能会遇到数据满了,此时就涉及到淘汰的问题,假设我们只能存4个值,淘汰表尾的数据.
此时我们就要把key4对应的hash映射删除,也把key4|val4从双向链表中摘除.
(2)这个数据存在,直接通过hash映射找到这个数据的位置,比如说key2,此时需要修改这个已经存在
的数据,还需要做一个重新链接将这个节点移动到我们的表头位置的下一位,将key2|val2这个节
点移动到表头的位置的下一位.
4.LRU算法的简单实现
include <unordered_map>
#include <string>
#include <algorithm>
#include <list>
#include <iostream>
using namespace std;
class LRUCache{
private:
int _capacity;
list<pair<int,int>> doubleLinkedList;
unordered_map<int,list<pair<int,int>>::iterator> hashmap;
public:
LRUCache(int capacity){_capacity = capacity;}
int get(int key)
{ if(not hashmap.count(key))
{
cout<<"xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"<<endl;
cout<<"key " <<key<<"对应的value不存在"<<endl<<endl;
return -1;
}
doubleLinkedList.splice(doubleLinkedList.begin(),doubleLinkedList,hashmap[key]);
cout<<"xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"<<endl;
cout<<"key "<<key<< "对应取到的value是"<<hashmap[key]->second<<endl<<endl;
return hashmap[key]->second;
}
void post(int key,int value)
{
//cout<<"line = 23.hashmap.count(key) = "<<hashmap.count(key)<<endl;
if((doubleLinkedList.size()==_capacity) and not hashmap.count(key))
{
// cout<<"line = 26 "<<endl;
hashmap.erase(doubleLinkedList.back().first);
doubleLinkedList.pop_back();
}
if(hashmap.count(key)!=0)
doubleLinkedList.erase(hashmap[key]);
doubleLinkedList.push_front({key,value});
hashmap[key]=doubleLinkedList.begin();
// cout<<"insert "<<endl;
}
void print()
{
cout<<"xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"<<endl;
for (list<pair<int,int>> ::iterator it = doubleLinkedList.begin(); it != doubleLinkedList.end(); it++)
{
cout <<"key is "<< it->first<<", value is "<<it->second << endl;
}
cout<<endl;
}
};
int main()
{
cout<<"设置的缓存大小是4."<<endl;
LRUCache cache = LRUCache(4);
cout<<"post(1,9)"<<endl;
cache.post(1,9);
cout<<"post(2,8)"<<endl;
cache.post(2,8);
cout<<"post(3,7)"<<endl;
cache.post(3,7);
cout<<"post(4,8)"<<endl;
cache.post(4,8);
cache.print();
cout<<"post(1,10)"<<endl;
cache.post(1,10);
cache.print();
cout<<"post(11,1)"<<endl;
cache.post(11,1);
cout<<"post(12,22)"<<endl;
cache.post(12,22);
cache.print();
cout<<"get(12)"<<endl;
cache.get(12);
cout<<"get(13)"<<endl;
cache.get(13);
}