- 博客(1)
- 资源 (5)
- 收藏
- 关注
原创 lucene smartcn原理
Smartcn分词器是ictclas简化功能的java版 Smartcn分词三步:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 例如:“他说的确实在理”这句话。 1)原子切分的目的是完成单个汉字的切分。经过原子切分后变成“始##始/他/说/的/确/实/在/理/末##末”。 2)然后根据“词库字典coredict”找出所有原子之间所有可能的组词
2010-06-13 20:23:00 9419
几个推荐算法的java实现
java实现的几个推荐算法:slopeone SVD,RSVD,ItemNeighborSVD
内有readme,相关内容在blog.csdn.net/lgnlgn
2012-01-05
基于随机游走的社团发现算法Hadoop版
基于随机游走的社团发现算法Hadoop版 以及一个graph生成程序。整个是个eclipse项目,没有把lib放上来。内容在
http://blog.csdn.net/lgnlgn/article/details/6561876 的下一篇博客
2011-07-07
二进制串模糊搜索的Java实现0.11
http://blog.csdn.net/lgnlgn/archive/2010/11/14/6008498.aspx 中提到的论文中的算法部分,整个eclipse工程打包了。
2011-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人