前一段时间.在微博上中奖了.
一个叫张俊林的帅锅.送了俺一本书.由于工作(其实是懒惰),一直木有好好看..书到手一个月了才看了80多页.
现在终于要过年了.开始看了..顺路给自己做个笔记.在这里我郑重推荐此书
<<这就是搜索引擎:核心技术详解>>
定 价:¥45.00
作 者:张俊林 著
出 版 社:电子工业出版社
出版时间:2012-1-1
[url]http://product.dangdang.com/product.aspx?product_id=22574992[/url]
好了广告 做完了..我先介绍一些索引压缩算法..
一.为什么压缩索引
海量的网页保存.需要消耗大量的磁盘空间.同事在索引读取的时候增加的磁盘的io.影响了性能所以压缩.
二.压缩的标准指标
1.压缩率 2.压缩速度 3.解压速度
三现在下面介绍第一种压缩算法.
EliasGamma算法
EG压缩算法利用分解函数将待压缩的数字分解为两个因子.之后分别用医院编码和二进制编码来表达这两个因子.
Elias Gamma 分解式如下 X = 2e + d (是2的e次方 .但是打不出来)
这里x为待解压的数字.e和d分别为其因子.对于因子 e+1采用一元编码表示.对于d用宽度为e的二进制编码来表示
一个叫张俊林的帅锅.送了俺一本书.由于工作(其实是懒惰),一直木有好好看..书到手一个月了才看了80多页.
现在终于要过年了.开始看了..顺路给自己做个笔记.在这里我郑重推荐此书
<<这就是搜索引擎:核心技术详解>>
定 价:¥45.00
作 者:张俊林 著
出 版 社:电子工业出版社
出版时间:2012-1-1
[url]http://product.dangdang.com/product.aspx?product_id=22574992[/url]
好了广告 做完了..我先介绍一些索引压缩算法..
一.为什么压缩索引
海量的网页保存.需要消耗大量的磁盘空间.同事在索引读取的时候增加的磁盘的io.影响了性能所以压缩.
二.压缩的标准指标
1.压缩率 2.压缩速度 3.解压速度
三现在下面介绍第一种压缩算法.
EliasGamma算法
EG压缩算法利用分解函数将待压缩的数字分解为两个因子.之后分别用医院编码和二进制编码来表达这两个因子.
Elias Gamma 分解式如下 X = 2e + d (是2的e次方 .但是打不出来)
这里x为待解压的数字.e和d分别为其因子.对于因子 e+1采用一元编码表示.对于d用宽度为e的二进制编码来表示