地址:[url]http://paoding.net[/url]
这是庖丁中文分词的示例应用。使用的分词器版本是2.0.4-alpha2。
有关心庖丁中文分词的同学,可以通过访问[url]http://paoding.net[/url]测试庖丁的搜索效果。
(2.0.4-alpha2发布时间是2007-10-22日)。
----------------------------------------------------------
索引范围:
新浪博客,2007-9-27日统计的点击率最前的1000名博客地址。
paoding建立了这1000个用户从其创建博客到2007-9-26日的所有文章,以及部分博客的9月27日的文章
----------------------------------------------------------
重要数据摘要:
博客数: 1000
博客文章数: >30万篇
Lucene索引库个数: 1个
索引库状态: 已优化
索引库大小: [color=red][b]3.03G[/b][/color]
操作系统: REHL4
查询效率: 没有不良体验
这是庖丁中文分词的示例应用。使用的分词器版本是2.0.4-alpha2。
有关心庖丁中文分词的同学,可以通过访问[url]http://paoding.net[/url]测试庖丁的搜索效果。
(2.0.4-alpha2发布时间是2007-10-22日)。
----------------------------------------------------------
索引范围:
新浪博客,2007-9-27日统计的点击率最前的1000名博客地址。
paoding建立了这1000个用户从其创建博客到2007-9-26日的所有文章,以及部分博客的9月27日的文章
----------------------------------------------------------
重要数据摘要:
博客数: 1000
博客文章数: >30万篇
Lucene索引库个数: 1个
索引库状态: 已优化
索引库大小: [color=red][b]3.03G[/b][/color]
操作系统: REHL4
查询效率: 没有不良体验