王哲ID:Damon_King
24813次访问,排名4672好友7人,关注者13
别人笑我太疯癫,我笑别人开裤裆
Damon_King的文章
原创 68 篇
翻译 1 篇
转载 32 篇
评论 72 篇
帝哲的公告
有事你Q我!!
最近评论
Damon_King:@狮子:
哈,习惯问题吧,看看网页啥的还行!
Damon_King:@PrideRock :
施主,生命在于折腾!阿弥陀佛……
狮子:Chrome 用着并不是很爽
已经被我pass掉了
PrideRock:别瞎折腾
Damon_King:自己坐沙发,然后心里骂一下:评论主页选项像姓名选项那样自动输入这个建议已经提N久了,怎么还没改呢,ND!
文章分类
收藏
相册
Damon.King's Photo
Google Logo
我的公司
个人链接
技术网站
C#开源资源
SubSonic架构
SubText主页
组织链接
HiDotNet论坛
铁血军事
铁血论坛
存档
订阅我的博客
XML聚合  FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
订阅到BlogLines
订阅到Yahoo
订阅到GouGou
订阅到飞鸽
订阅到Rojo
订阅到newsgator
订阅到netvibes

Google黑板报我收藏的Google黑板报文章,也是我能看懂的,哈哈……

转载 数学之美系列二十一 - 布隆过滤器(Bloom Filter)收藏

布隆过滤器在过滤中的应用…… 比如说,一个象 Yahoo,Hotmail 和 Gmai 那样的公众电子邮件(email)提供商,总是需要过滤来自发送垃圾邮件的人(spamer)的垃圾邮件。一个办法就是记录下那些发垃圾邮件的 email 地址。由于那些发送者不停地在注册新的地址,全世界少说也有几十亿个发垃圾邮件的地址,将他们都存起来则需要大量的网络服务器。如果用哈希表,每存储一亿个 email 地址, 就需要 1.6GB 的内存(用哈希表实现的具体办法是将每一个 email 地址对应成一个八字节的信息指纹 googlechinablog.com/2006/08/blog-post.html,然后将这些信息指纹存入哈希表,由于哈希表的存储效率一般只有 50%,因此一个 email 地址需要占用十六个字节。一亿个地址大约要 1.6GB, 即十六亿字节的内存)。因此存贮几十亿个邮件地址可能需要上百 GB 的内存。除非是超级计算机,一般服务器是无法存储的。 今天,我们介绍一种称作布隆过滤器的数学工具,它只需要哈希表 1/8 到 1/4 的大小就能解决同样的问题。阅读全文>

发表于 @ 2008年04月29日 10:01:00|评论(loading...)|收藏

Csdn Blog version 3.1a
Copyright © 帝哲