cabinet可以使用Hadoop Map File实现
之前为了加速读取solr中的文献(文献有几千万,每个几K),我用c++和thrift实现了一个叫cabinet的服务。其中key是一个32位整数,value是一个string,是一个thrift序列化后的字节数组。支持增加、删除、修改和读取,读取性能要很好。所以实现上就把索引(key为文献id,value为文献在数据文件中的位置)存在内存中,读取时只读取一次硬盘。修改和删除的记录则存在另外两个ma
原创
2013-11-02 12:44:20 ·
1221 阅读 ·
0 评论