- 博客(10)
- 收藏
- 关注
原创 自然语言处理在搜索引擎信息检索中的应用
自然语言处理在搜索引擎信息检索中的应用文章介绍了2002时使用的三种搜索技术,并提出了一个信息检索模型,并提出了一种分析输入搜索串以提高搜索精度的算法。三种搜索技术是:基于robot的搜索、元搜索、目录搜索。基于robot的搜索使用robot(spider或crawler)获取抓取网络上Web页面的内容,按照一定的存储结构存储到数据库中。当用户发出搜索请求时,服务器从数据库中搜索
2006-11-30 21:20:00
4774
原创 自然语言处理的三个里程碑
自然语言处理的三个里程碑文章讲述了自然语言处理历史中发现的两个事实和三个里程碑式的进展。两个事实分别为:一、短语结构语法不能有效地描写自然语言。为了识别句子的语法结构,将句子中的词一个一个切分出来,然后查词典,给每个词指派一个合适的词性;在这个基础上,用句法规则把句子里包含的句法成分逐个识别出来,进而判断每个短语的句法功能及语义角色。最终得到的句子的意义表示。短语结构语法在自然语
2006-11-29 14:00:00
5090
原创 自然语言处理的学科定位
自然语言处理应该经过以下四个方面:第一、把需要研究的问题在语言学上加以形式化,建立语言的形式化模型,使之能够以一定的数学形式表示出来;二、将这种严密而规整的数学形式表示为算法,使之在计算上形式化;三、根据算法编写计算机程序,使之在计算机上得以实现;四、对实现的系统进行评测、改进质量和性能。在这四个阶段中,第一阶段更大程度上是语言学家和数学家的工作,后面的几个阶段则更属于计算机科学家的工作。不
2006-11-28 16:15:00
2285
原创 自然语言处理基础学习
自然语言的处理发展以来经历了多个阶段。初期的研究主要注重于自然语言的语法。80年代初期,计算机语言蓬勃发展,形式语言理论趋向成熟,这使得自然语言的处理也求助于形式语言。但由于形式语言语法和语义的分离性,以及自然语言的上下文有关性,导致不能得到广泛的运用。扩种转移网络ATN是一种多功能自然语言的语法表示理论。它对表层和深层结构分析同时进行,所以对语言中规整的部分而言是一种可实现的、有效的
2006-11-27 15:01:00
2745
原创 类的大小
struct C{ double b; int c; int d; int i; union ui { char c; double d; };};struct D{ union { char c;
2006-11-15 22:35:00
733
原创 程序设计实践(测试)
6测试在日常的手工或者通过办公机器的计算实践中,人们形成了一种习惯,那就是要检查计算的每个步骤。如果发现了错误,确认它的方式就是从第一次注意到错误的那个地方开始,做反向的处理。 ---- Norbert Wi e n e r (诺伯特·维纳),《控制论》学问发展到了极致只有两个方向:哲学和数学。同样的话,在不同人的心理,认识不一样,由不同的方式说出来,感觉不一样。《论语
2006-11-01 15:58:00
1063
原创 程序设计实践(排错)
作为程序员,对代码排错应该绝不陌生。从当初的“hello,world!”到后来的大规模应用,排错一直陪伴着我们。很早的时候,照着书敲程序,编译的时候却出来一大堆错误,手足无措,百思不得其解,最后不了了之。错了就错了吧,扔那儿不管了。偶尔也会认为这是工具(编译器)的错误,或者书上的例子错了。现在回想起来,都是自己的错误罢!奇迹总是很少的,不然也不会称之为奇迹,程序出了问题,多半还是自己的错误,
2006-10-31 15:38:00
892
原创 算法和数据结构
1. 算法和数据结构一种说法是算法是程序的灵魂;一种说法是算法+数据结构=程序。我更加同意第一种说法。数据结构是为算法服务的。程序的特性、需求决定了需要采用何种算法,也就决定了要采用何种数据结构。编译器要求速度尽可能快,要能够处理成百上千万行代码,因此不可能采用数组或者二叉搜索树来存储数据,而只能采用hash表。如果要不停的插入、删除数据,则只能选择链表而不能采用数组。基本的算
2006-10-28 16:48:00
837
原创 程序设计实践——学习
1. 程序设计风格程序设计是一种艺术,漂亮的代码不仅自己让程序员自己有强烈的成就感,也让其他读者(测试人员、维护人员)感到赏心悦目,更加重要的是代码的可阅读性、可维护性。漂亮的代码不仅仅包括设计精良的架构,优雅的数据结构,清晰逻辑,也包括代码的风格。代码的风格颇具争议的一个话题,在程序设计的早期(60年代~70年代),还有一堆牛人写论文来谈代码风格(不像现在这样动不动就是一本书
2006-10-27 21:52:00
850
原创 U2TP学习随笔(一)
学习了一段时间的u2tp,仍然模糊不清,现在才知浅薄。现把相关概念整理一下,文中引用了大量他人的观点或语言,由于太多,也就不一一例出作者与引用出处。权当个人学习总结,不能当真。a) UML:统一建模语言(Unified Modeling Language)。提供了一种对软件系统进行可视化、详述、构造和文档化的工业标准机制。它为描述系统提供了一种语言。b) MOF:(Me
2005-09-06 20:07:00
1397
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人