批量读取文本文件并生成自己的肖像词云

最近经常有朋友在群里问批量文本分析方面的问题,这里我给出了批量读取文本文件并生成自己的肖像词云的一个简单例子。

library(rJava)
library(Rwordseg)
library(RColorBrewer)
library(wordcloud)
library(wordcloud2)
#路径
dir <- "D:/C000007"
#路径下文件名
names <- list.files(dir)
dirname <- paste(dir,names,sep="/")
#文件数量
n <- length(dirname)
finaldata = read.csv(file = dirname[1],stringsAsFactors=F,header=F)

#循环组装到一个data.frame中
for (i in 2:n)
{
  new.data = read.csv(file = dirname[i],stringsAsFactors=F,header=F)
  flen=length(new.data)
  if(flen==1) finaldata = rbind(finaldata,new.data)
  if(flen>1)
  { 
    newstr=''
    for(j in 1:flen)
    {
      newstr=paste(newstr,new.data[,j])
    }
    newdataframe=data.frame(V1=newstr)
    finaldata = rbind(finaldata,newdataframe)
  }
  
}


#可使用write.table  将finaldata写出

#分词并统计词频
words=unlist(lapply(X=finaldata$V1, FUN=segmentCN))
word=lapply(X=words, FUN=strsplit, " ")
v=table(unlist(word))
#降序排列
v=rev(sort(v))
#组装成词云数据框
d=data.frame(v,row.names = names(v))

#绘制词云
mydata=d
wordcloud2(mydata,size = 0.3,figPath='D:/csdn博客文章/头像.jpg')

上述代码中我的注释已经标注的很清楚了,相信大家能看懂。

如有任何问题想跟我交流或者向我索要测试数据,可以加群R语言&大数据分析(群号456726635)跟我联系。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值