jieba分词
文章平均质量分 76
浅曦忆
一个初出茅庐的程序媛,正在代码的路上奋斗
展开
-
jieba分词的应用(java)
在上一篇说的猜你喜欢功能中,又加了新的需求,需要对关键词进行分词,扩大推荐文章的范围,这样能够拓展用户的喜欢范围,这时候我就想到可以用jieba分词对中文进行分词,同样的需要去官网下载源码,这样方便自己对源码的修改以达到自己的目的。这里,我需要判断切分出来的词是否是无意义的词,就需要对切出来的词进行筛选,这时候,jieba分词的一个属性就体现出它的强大之处了,jieba分词会将切分出来的词进行词性原创 2018-01-08 17:49:31 · 15865 阅读 · 10 评论 -
Tensorflow+gensim实现文章自动审核功能
首先,一定要吐槽一下,千万不要拿笔记本跑训练集很大的模型,不然真的能跑到吐血三升,而且电脑卡到宕机之后好不容易等到电脑能动了就是报错“内存不足”,简直能逼死我。每次跑程序都得把虚存开到最大,然后看着我的电脑在那卡卡卡,我都在想会不会把我电脑跑废了。当然结局是美好的,因为模型跑出来的审核结果正确率在94%以上,简直是惊喜到不行,嗯,基于这个理由,给我配工作站让我专门跑算法了,开心~ 好了,言归正传...原创 2018-03-12 15:58:35 · 2344 阅读 · 7 评论