数学之美 系列十三 信息指纹及其应用

转载 2007年10月02日 11:57:00

 信息指纹及其应用


数学之美系列十三:信息指纹及其应用

转自:http://www.kuqin.com/math/20071204/2787.html 任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint...

数学之美系列十三:信息指纹及其应用

信息指纹的用途远不止网址的消重,信息指纹的的孪生兄弟是密码。信息指纹的一个特征是其不可逆性, 也就是说, 无法根据信息指纹推出原有信息,这种性质, 正是网络加密传输所需要的。比如说,一个网站可以根据用...

数学之美系列十三:信息指纹及其应用

任何一段信息文字,都可以对应一个不太长的随机数,作为区别它和其它信息的指纹(Fingerprint)。只要算法设计的好,任何两段信息的指纹都很难重复,就如同人类的指纹一样。信息指纹在加密、信息压缩和处...
  • RFC2008
  • RFC2008
  • 2012年05月01日 16:17
  • 315

数学之美系列七:信息论在信息处理中的应用

我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。 先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者...
  • RFC2008
  • RFC2008
  • 2012年05月01日 15:59
  • 506

数学之美 系列七 -- 信息论在信息处理中的应用

我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。 先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者...

文本分析系列——基于相似哈希信息指纹的文本相似度算法

曾经使用这个算法进行文章查重的应用(日常排查100w篇左右),以下只是整个计算的原理和过程,计算的效率 更多是根据编程语言和架构决定,并不是本文关注的重点。 计算原理:         布隆过滤原理,...

数学之美系列四:怎样度量信息?

信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948  年,香农提出了“ 信息熵”(sh ā ng)  的概念...

数学之美系列 4 -- 怎样度量信息?

发表者:吴军,Google 研究员 前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每一条信息应该怎样度量呢? 信息是个很抽象的概念。我们常常说...

数学之美系列之四:怎样度量信息?

http://blog.csdn.net/zhz_2v/article/details/1676573 前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数学之美 系列十三 信息指纹及其应用
举报原因:
原因补充:

(最多只允许输入30个字)