<<这就是搜索引擎>>学习笔记-算法之索引压缩

28 篇文章 0 订阅
11 篇文章 0 订阅
前一段时间.在微博上中奖了.
一个叫张俊林的帅锅.送了俺一本书.由于工作(其实是懒惰),一直木有好好看..书到手一个月了才看了80多页.
现在终于要过年了.开始看了..顺路给自己做个笔记.在这里我郑重推荐此书

<<这就是搜索引擎:核心技术详解>>

定  价:¥45.00

作  者:张俊林 著

出 版 社:电子工业出版社

出版时间:2012-1-1

[url]http://product.dangdang.com/product.aspx?product_id=22574992[/url]


好了广告 做完了..我先介绍一些索引压缩算法..

一.为什么压缩索引
海量的网页保存.需要消耗大量的磁盘空间.同事在索引读取的时候增加的磁盘的io.影响了性能所以压缩.


二.压缩的标准指标
1.压缩率 2.压缩速度 3.解压速度


三现在下面介绍第一种压缩算法.

EliasGamma算法

EG压缩算法利用分解函数将待压缩的数字分解为两个因子.之后分别用医院编码和二进制编码来表达这两个因子.

Elias Gamma 分解式如下 X = 2e + d (是2的e次方 .但是打不出来)

这里x为待解压的数字.e和d分别为其因子.对于因子 e+1采用一元编码表示.对于d用宽度为e的二进制编码来表示
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值