现在有很多方法可以用来分析文本的观点或者情感。在tidytext程序包中,有一些情感词典,常用的是以下三个:
-
AFINN:对单词打分,介于-5和+5之间。分数越高,词汇越正面。
-
bing:这个是Bing Liu等人开发的。他有一本书,叫做Sentiment Analysis: mining sentiments, opinions, and emotions。有兴趣的朋友可以读一下。
-
nrc:nrc情感词典包括英语中8种感情(生气、恐惧、希望、信任、惊奇、悲伤、高兴和反感)。
这三个词典都建立在单词之上。它们根据正面感情和负面感情对英语词汇分类。下面,我们来看一下如何使用这三个词典。
首先,我们需要下载textdata程序包,并且引用它和tidytext程序包。
install.packages("textdata")
library(textdata)
library(tidytext)
接下来,我们就可以用get_sentiments()函数调用这三个词典。
get_se