准备
1.install.packages("jiebaR")
因为Rwordseg在3.2.3版本R中无法使用,而已没有jiebaR那么方便。
2.install.packages("wordcloud")
数据读取
随便复制一篇文章到自己的某个文件夹下。
text<- scan('F:/new.txt',sep='\n',what='')#F:/new.txt为你的原文本内容
分词
segments<-qseg[text]
数据预处理
去除数字等不是很重要的词,例如(1,地,的)等
segments <- gsub("\\d","",segments)
segments <- segments[segments !=""] #去除空字符串
segments<- segments[nchar(segments) > 1]#去除字符长度小于1的字符串
统计词频
segments<- table(segments)
segments<- sort(segments, decreasing = T) #从大到小排序,词频,默认是小到大
绘制词云
wordcloud(names(segments), segments, colors = rainbow(12), random.order=F)