自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_18674585的博客

原创 Viterbi分词详解-hanlp

1.根据词库，生成所有所有字可能组成的词（词网）。例如：当下雨天地面积水分外严重0:[ ]1:[当, 当下]2:[下, 下雨, 下雨天]3:[雨, 雨天]4:[天, 天地]5:[地, 地面]6:[面, 面积]7:[积, 积水]8:[水, 水分]9:[分, 分外]10:[外]11:[严, 严重]12:[重]13:[ ]前后空为起始和末尾标志2.通过遍历上述词网0：1:当 A1，当下 A2通过“当”...

2018-07-16 10:39:37 1264 1

原创中国人名识别

基于角色标注的中国人名识别的原理和流程：编码代码意义例子BPf姓氏张华平先生CPm双名的首字张华平先生DPt双名的末字张华平先生EPs单名张浩说：“我是一个好人”FPpf前缀老刘、小李 GPlf后缀王总、刘老、肖氏、吴妈、叶帅KPp人名的上文又来到于洪洋的家。LPn人名的下文新华社记者黄文摄MPpn两个中国人名之间的成分编剧邵钧林和稽道青说UPpf人名的上文和姓成词这里有关天培的壮烈VPnw人名...

2018-07-16 10:38:44 3378

原创自定义插件

通过重写QueryParser实现 1，继承CustomScoreProvider类，重写customScore方法，从DocValues中动态读取评分有关因子，计算后，影响总评分 2，继承CustomScoreQuery类，重写getCustomScoreProvider方法，需要用到1，返回自定义的CustomScoreProvider类到此，在lucene中就完事了，但是在solr中我们还...

2018-07-16 10:36:57 199

原创倒排索引的利用

1.配置需要对schema中的查询字段设置indexed="true" termPositions="true" termVectors="true" 2.termVector使用通过termVector = reader.getTermVector(int docID, String field)获取文档id对应字段向量通过字段向量，可以获取该字段中所有词和其词频，暂时还未找到方法获取其位置。3...

2018-07-16 10:35:47 474

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_18674585 CSDN认证博客专家 CSDN认证企业博客

码龄10年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

4: 原创

67万+: 周排名

120万+: 总排名

5315: 访问

: 等级

92: 积分

0: 粉丝

2: 获赞

1: 评论

3: 收藏

私信

关注

分类专栏

solr 2篇
nlp 2篇
工作

最新评论

Viterbi分词详解-hanlp
地主家的小兵将: 楼主有代码吗

最新文章

提示

确定要删除当前文章？

取消删除