先介绍文本情感分析主要的数据集:
Stanford Sentiment Treebank 11855个句子划分为239231个短语,每个短语有个概率值,越小越负面,越大越正面链接
IMDB 100,000句子,正面负面两类链接 (附LSTM和CNN实现IMDB数据集代码:https://github.com/HqWei/Sentiment-Analysis)
Yelp 无 链接
Multi-Domain Sentiment Dataset(Amazon product) 100,000+句子,正面负面2类或强正面、弱正面、中立、弱负面、强负面5类链接
SemEval 20,632句子,三类(正面、负面、中立)链接
Sentiment140(STS) 1,600,000句子,三类(正面、负面、中立)链接
大部分数据集介绍分类介绍以及下载链接:
https://www.cnblogs.com/xiaojianliu/p/9446358.html