数据集说明:本次情感分析使用电影评论数据1500条,包含好评、中评、差评各500条;
【1】数据读取;
【2】数据清洗;
【3】评论分词;
【4】数据整理(方便情感打分);
【5】词典读取;
【6】定位情感词;
【7】评论情感倾向可视化(ggplot2);
【8】词云图(wordcloud,wordcloud2)
四、实操过程:
(一)、数据读取:
数据读取部分可能因文件编码问题导致读取乱码,在此,可先转换文本编码为“utf-8”或是采取其他方式读取:
如:readr包的read_csv()
data.table包的fread()
或是:
read.csv()\read.table()
#一、载入所需R包:
#这里使用pacman包的p_load()函数加载所需R包,省去逐个library()的繁琐&#x