搜索微谈
jicheng687
这个作者很懒,什么都没留下…
展开
-
MMAnalyzer中文搜索(极易中文分词组件)
字符串切分 package demo.analysis; import java.io.IOException; import jeasy.analysis.MMAnalyzer; public class Segment { public static void main(String[] args) { String text = "据路透社报道,印度尼西亚社会事务部一官员星期二(29日原创 2009-08-04 11:31:00 · 2038 阅读 · 3 评论 -
Naive Bayes 算法(NB算法)
Naive Bayes 算法(NB算法)俺不是大牛啊,只能写写这种浅显的文章了,算是抛砖引玉吧naive bayes(朴素贝叶斯,下面简称NB ^_^)是ML中的一个非常基础和简单的算法,常常用它来做分类,我用它做过text classification。现在的研究中大概已经很少有人用它来实验了(除非是做base line),但确实是个很好的入门的算法,来帮助自己更加深转载 2009-08-04 09:31:00 · 1576 阅读 · 3 评论 -
分类算法总结
几天下来,终于把分类算法写好了,从读论文,到建模,再到代码实现,真的不容易。其中用到了Naive Bayes 算法, 还有Lucene组件和极易中文分词组件,很感谢一网友的blog中的文章,帮了我不少,很感谢。原创 2009-08-06 23:12:00 · 656 阅读 · 0 评论