R语言 微博
NvLand
这个作者很懒,什么都没留下…
展开
-
R语言微博数据处理(2)
昨天完成了对@User的匹配,今天阅读了《30分钟学习正则表达式》,终于把#Hashtags#的匹配完成了。#拿到所有的hashtagx m regmatches(x, m)查了很多相关的#的正则匹配,结果还是简单的才是好用的,满足自己需求的还是好使的。原创 2015-02-14 20:54:52 · 651 阅读 · 0 评论 -
R语言的微博数据处理
用R语言处理微博数据,用到TM包,rJava包,slam包,自己还对李舰老师的Rwordseg进行了反编译,将最新的ansj弄了进去。首先来进行下微博的处理,我将每一个用户的微博放在一个文档中,文档名为用户id+.txt。首先导入需要用的包:##################导入相关包,设置workspace#######################library(tm)原创 2015-02-14 00:22:50 · 3405 阅读 · 1 评论