搜索引擎
文章平均质量分 72
yanyongshan
这个作者很懒,什么都没留下…
展开
-
推荐引擎mahout相关资料
推荐引擎mahout相关资料文章分类:综合技术http://www.ibm.com/developerworks/cn/java/j-mahout/http://xlvector.cnhttps://groups.google.com/group/resys著名博客Daniel Lemire http://www.daniel-lemire.comGre原创 2010-01-06 14:34:00 · 413 阅读 · 0 评论 -
google
<br /><br /> <br /> <br /> <br />转载 2010-07-06 18:43:00 · 540 阅读 · 0 评论 -
ICTCLAS分词系统
ICTCLAS分词系统研究(一) ICTCLAS分词系统研究(二)--词典结构 ICTCLAS分词系统研究(三)--原子切分 2007年06月04日 ICTCLAS分词系统研究(十)--后记ictclas研究历程阅读全文>发表于 @ 2007年06月04日 14:25:00 | 评论( 7 ) | 举报| 收藏 ICTCLAS分词系统转载 2010-05-25 12:46:00 · 898 阅读 · 0 评论 -
向量空间模型
<br /><br />向量空间模型(VSM:Vector space model)是最常用的相似度计算模型,在自然语言处理中有着广泛的应用,这里简单介绍一下其在进行文档间相似度计算时的原理。<br />假设共有十个词:w1,w2,......,w10,而共有三篇文章,d1,d2和d3。统计所得的词频表(杜撰的,为了便于演示用法)如下: <br />w1<br />w2<br />w3<br />w4<br />w5<br />w6<br />w7<br />w8<br />w9<br />w10<br /转载 2010-06-10 21:48:00 · 860 阅读 · 0 评论