数学之美 系列七 -- 信息论在信息处理中的应用

2006年5月25日 上午 07:56:00uT("time114822338683782989");发表者:吴军, Google 研究员 我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型...

2006-05-26 10:54:00

阅读数 1086

评论数 0

数素数

数素数Time Limit:1s Memory Limit:1000k Total Submit:23202 Accepted:3658 下载样例程序(PE)下载样例程序(ELF) Problem素数是的只能被1和它本身整除的自然数。判断一个数是素数的方法是使用2到该数的平方根的素数除它,若有能整...

2006-05-19 14:48:00

阅读数 1195

评论数 1

Matrix Chain Multiplication

Time limit: 1 Seconds   Memory limit: 32768K   Total Submit: 468   Accepted Submit: 308   Matrix multiplication problem is a typical example of dynam...

2006-05-18 00:22:00

阅读数 1704

评论数 0

Humble Numbers

Time limit: 1 Seconds   Memory limit: 32768K   Total Submit: 1799   Accepted Submit: 660   A number whose only prime factors are 2,3,5 or 7 is called...

2006-05-17 23:34:00

阅读数 1665

评论数 0

中文搜索引擎技术揭密:排序技术

http://FullSearch.Com 中文全文检索网 2004-9-18 23:15:41 winter 关键词:中文搜索引擎技术揭密 ...

2006-05-17 21:29:00

阅读数 1071

评论数 0

中文搜索引擎技术揭密:网络蜘蛛

http://FullSearch.Com 中文全文检索网 2004-9-18 23:15:33 winter 关键词:中文搜索引擎技术揭密 ...

2006-05-17 21:25:00

阅读数 982

评论数 0

中文搜索引擎技术揭密:系统架构

http://FullSearch.Com 中文全文检索网 2004-9-18 23:15:24 winter 关键词:中文搜索引擎技术揭密 ...

2006-05-17 21:10:00

阅读数 1336

评论数 0

中文搜索引擎技术揭密:中文分词

http://FullSearch.Com 中文全文检索网 2005-1-13 8:35:56 winter 关键词:中文搜索引擎技术揭密 ...

2006-05-17 21:04:00

阅读数 923

评论数 0

搜索引擎基本工作原理

 ■ 全文搜索引擎   在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取...

2006-05-17 20:48:00

阅读数 928

评论数 0

搜索引擎分类

  搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。 ■ 全文搜索引擎   全文搜索引擎是名副其实的搜索引擎,国外具代表...

2006-05-17 20:43:00

阅读数 863

评论数 0

搜索引擎发展史

  在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。  现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时Wo...

2006-05-17 20:38:00

阅读数 973

评论数 0

Code the Tree

Code the TreeTime limit: 1 Seconds   Memory limit: 32768K   Total Submit: 437   Accepted Submit: 124   A tree (i.e. a connected graph without cycles)...

2006-05-16 19:37:00

阅读数 1216

评论数 0

Simple Computers

Simple ComputersTime limit: 1 Seconds   Memory limit: 32768K   Total Submit: 507   Accepted Submit: 151   You are to write an...

2006-05-16 00:30:00

阅读数 1008

评论数 0

数学之美 系列六 -- 图论和网络爬虫 (Web Crawlers)

2006年5月15日 上午 07:15:00uT("time114733040963327560");发表者: 吴军,Google 研究员 [离散数学是当代数学的一个重要分支,也是计算机科学的数学基础。它包括数理逻辑、集合论、图论和近世代数四个分支。数理逻辑基于布尔运算,我们已...

2006-05-15 12:04:00

阅读数 1158

评论数 0

HTML

HTMLTime limit: 1 Seconds   Memory limit: 32768K   Total Submit: 1784   Accepted Submit: 458   If you ever tried to read a html document on a Macinto...

2006-05-14 19:27:00

阅读数 1102

评论数 0

kitty猫的基因编码

kitty猫的基因编码Time Limit:1s Memory Limit:1000k Total Submit:4105 Accepted:1529 Problemkitty的基因编码如下定义: kitty的基因由一串长度2^k(kInput一行,长度为2^k,为kitty猫的01基因编码,有多...

2006-05-13 19:43:00

阅读数 1822

评论数 1

智能T9英文输入法

智能T9英文输入法Time Limit:1s Memory Limit:1000k Total Submit:1556 Accepted:534 下载样例程序(PE)下载样例程序(ELF) Problem某款新型手机为了方便用户,希望开发一种新的英文输入法.要求在输入英文的时候输入法不但能够做到自...

2006-05-12 18:31:00

阅读数 3546

评论数 1

单词的划分

单词的划分Time Limit:1s Memory Limit:1000k Total Submit:2558 Accepted:1134 下载样例程序(PE)下载样例程序(ELF) Problem有一个很长的由小写字母组成字符串。为了便于对这个字符串进行分析,需要将它划分成若干个部分,每个部分称...

2006-05-12 15:33:00

阅读数 1410

评论数 0

线型网络

线型网络Time Limit:10s Memory Limit:1000k Total Submit:7076 Accepted:1299 下载样例程序(PE)下载样例程序(ELF) Problem有 N ( 接一台地依次连接他们,最后接到哪个以及连接的顺序也是由你选定的,为了节省材料,网线都拉直...

2006-05-11 00:58:00

阅读数 1107

评论数 0

数学之美 系列五 -- 简单之美:布尔代数和搜索引擎的索引

2006年5月10日 上午 09:10:00uT("time114722733511630150");发表者: 吴军,Google 研究员 [建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。我们在介绍 Goo...

2006-05-10 22:19:00

阅读数 1002

评论数 0

提示
确定要删除当前文章?
取消 删除