
【自然语言处理】
文章平均质量分 92
君的名字
talk is cheap, show me the code!
只要xian哥在,世界充满爱!爱心发射,biubiu~biubiu~❤ ❤ ❤ ❤
展开
-
python实现获取文件列表中每个文件关键字
功能描述:获取某个路径下的所有文件,提取出每个文件中出现频率最高的前300个字。保存在数据库当中。前提,你需要配置好nltk#!/usr/bin/python#coding=utf-8'''function : This script will create a database named mydb then abstract keywo原创 2014-12-18 11:59:26 · 4971 阅读 · 0 评论 -
自然语言处理中的几种文本预处理的写法总结
写在前面的话biaji,<( ̄3 ̄)> bia叽,嘎嘎,最近来教大家写点简单又迷人的自然语言处理的代码。不好意思,原谅我用词不当,毕竟我是菜鸟,也没得资格教别人,the main reason is that 我自己写了给自己看的,你看我就是这样一个正直,又不爱慕虚荣的小公主呢~感觉自己萌萌哒,啊哈哈哈,不要脸也确实是真的反正也没有啥子浏览量,估计就是自己每天看自己写的...原创 2018-08-30 15:51:48 · 12665 阅读 · 9 评论 -
【带你玩转主题模型Topic Model】—— 之 利用sklearn 实现Latetnt Dirichlet Allocation(LDA)主题模型
写在前面的话9月份的第一篇blog, 正好是开学季,作为一个学生,hahahha, 我还是正正经经的贡献一篇认为比较干货的文章给大家吧。我自己是花了很多时间去看懂LDA的算法了,当然了这篇文章不涉及我们具体的原理。为什么呢,我觉得你还是要搞懂的,其实不是很难,当然如果你看到数学就头大的话,并且你是个害怕困难的人,那就当我说的是错的。如果你很喜欢研究,很喜欢挑战,很喜欢思考的话,我相信你一定会和...原创 2018-09-20 22:10:14 · 4916 阅读 · 19 评论