分词词云 logistic相关研究 2016.05.16回顾
上午研究了下分词,词频统计,生成词频云,把某几个QQ群的聊天记录导出做了实验,效果还是可以,程序是在别人的程序基础上修改的,主要涉及到jieba模块用于中文分词,wordcloud模块用于生成词云,画图是用到matplotlib,还写了个清洗QQ聊天记录的程序,主要是去掉一些系统生成的关于日期发言人等无用信息,同时也算温习了正则表达式之类的知识,还挺好玩的,我一直尝试想导出微信的数据,特别是朋友圈的
原创
2016-05-17 14:22:34 ·
382 阅读 ·
0 评论