ZBNO 中文自动断词引擎开源项目
简介:
英文句子里的词汇都有空格分开,中文句子里的词却没有这个特点。如何识别中文词语便成了中文信息检索的关键技术之一。ZBNO在此公布我们的《中文自动断词引擎开源项目》,希望对各位有有志开发中文信息检索的研究者带来启示。
下载地址:http://www.zbno.com/seg.jsp
开源的HTML解析器-- HTML Parser
简介:
HTML Parser 是一个对现有的 HTML 进行分析的快速实时的解析器,事实上在应用过程中你更为惊叹于 HTML Parser 给你带来一些周到的处理。这个项目更新很快,目前已经更新到1.6版本了。
主页:http://sourceforge.org/projects/htmlparser
下载地址:http://prdownloads.sourceforge.net/htmlparser/htmlparser1_6_20050925.zip?download