来源:GitHub
作者:SophonPlus
ChineseNlpCorpus
搜集、整理、发布中文自然语言处理 语料/数据集,与有志之士共同促进中文自然语言处理 的 发展。
情感/观点/评论 倾向性分析
1、ChnSentiCorp_htl_all 数据集
- 数据概览:7000 多条酒店评论数据,5000 多条正向评论,2000 多条负向评论
- 下载地址:
https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/ChnSentiCorp_htl_all/intro.ipynb
2、waimai_10k 数据集
- 数据概览:某外卖平台收集的用户评价,正向 4000 条,负向 约 8000 条
- 下载地址:
https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/waimai_10k/intro.ipynb
3、online_shopping_10_cats 数据集
- 数据概览:10 个类别,共 6 万多条评论数据,