R语言数据可视化词云绘制

需要的程序包

jiebaR,jiebaRD:分词

wordcloud2:绘制词云

installpackage('jiebaR','jiebaRD','wordcloud2) #安装程序包

运行程序包

library(jiebaR,jiebaRD) 
library(wordcloud2)

导入数据

news <- read.csv(''C:/Users/Administrator/Desktop/news.csv'') #读取csv格式文件
news <- read_excel(''C:/Users/Administrator/Desktop/news.csv'') #读取xls 和 xlsx 格式文件

 

 

text<-news$x #提取文本数据所在列

分词

mixseg<-worker("mix") #建立模型分词
a<-segment(text,mixseg) #开始分词

去停用词

需要将对研究无意义的词去除,再次只提供了示例代码。

stopwords <- read.table("C:/Users/Thinkpad/Desktop/停用词.txt")
class(stopwords) 
stopwords <- as.vector(stopwords[,1]) 
wordResult <- removeWords(a,stopwords)

绘制词云

freq<-table(a) #词频统计
freq   #查看词频统计结果
wordcloud2(freq,shape='star') #绘制词云

 

 

发福的星星型词云!

参数解读

wordcloud2(data, size = 1, minSize = 0, gridSize =  0,
fontFamily = 'Segoe UI', fontWeight = 'bold',
color = 'random-dark', backgroundColor = "white",
minRotation = -pi/4, maxRotation = pi/4, shuffle = TRUE,
rotateRatio = 0.4, shape = 'circle', ellipticity = 0.65,
widgetsize = NULL, figPath = NULL, hoverFunction = NULL)

data:包含每列中的word和freq的数据帧,按照word出现的顺序由内向外画图(可以按照freq降序美化wordcloud)。

size:字体大小,默认为1。较大的大小意味着较大的单词。

fontFamily:要使用的字体。

fontWeight:字体重量,例如normal, bold or 600

color:文本的颜色,可以使用关键字random-dark和random-light。也支持颜色矢量。

minSize:字幕的字符串

backgroundColor:背景的颜色。

gridSize:用于标记画布可用性的网格大小,网格大小越大,单词之间的差距越大。

minRotation:文本应该旋转的最小旋转(以rad为单位)。

maxRotation:文本应旋转的最大旋转(以rad为单位)。

rotateRatio:单词旋转的概率。将数字设置为1以始终旋转。

shape:绘制“云”的形状。 ‘circle’ (default), ‘cardioid’ (心形’,苹果或心形曲线,最知名的极坐标方程), ‘diamond’ (菱形), ‘triangle-forward’(三角形前移), ‘triangle’(三角形), ‘pentagon’(五角形), and ‘star

ellipticity:平坦度

figPath:画布路径

更多文章: 

                                                  

  • 6
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值