自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (5)
  • 收藏
  • 关注

原创 lucene smartcn原理

Smartcn分词器是ictclas简化功能的java版 Smartcn分词三步:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 例如:“他说的确实在理”这句话。 1)原子切分的目的是完成单个汉字的切分。经过原子切分后变成“始##始/他/说/的/确/实/在/理/末##末”。 2)然后根据“词库字典coredict”找出所有原子之间所有可能的组词

2010-06-13 20:23:00 9419

几个推荐算法的java实现

java实现的几个推荐算法:slopeone SVD,RSVD,ItemNeighborSVD 内有readme,相关内容在blog.csdn.net/lgnlgn

2012-01-05

基于随机游走的社团发现算法Hadoop版

基于随机游走的社团发现算法Hadoop版 以及一个graph生成程序。整个是个eclipse项目,没有把lib放上来。内容在 http://blog.csdn.net/lgnlgn/article/details/6561876 的下一篇博客

2011-07-07

二进制串模糊搜索的Java实现0.2

在之前版本http://download.csdn.net/source/3339688 上增加修改了一些

2011-06-18

二进制串模糊搜索的Java实现0.11

http://blog.csdn.net/lgnlgn/archive/2010/11/14/6008498.aspx 中提到的论文中的算法部分,整个eclipse工程打包了。

2011-06-04

二进制串模糊搜索的Java实现0.1

WWW07的 Detecting Near-Duplicates for Web Crawling 算法部分,eclipse工程整个打包了

2011-06-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除