这里给出了常用的自然语言处理任务的数据集以及一些语料库的链接下载,分中英文两个方面。大部分是电商评论类的数据。
英文数据集
Web data: Amazon reviews
https://snap.stanford.edu/data/web-Amazon.html
http://jmcauley.ucsd.edu/data/amazon/
Restaurant Reviews Dataset
http://www.cs.cmu.edu/~mehrbod/RR/
Movie Review Data
http://www.cs.cornell.edu/people/pabo/movie-review-data/
中文数据集
Amazon.cn Dataset:
https://sites.google.com/site/homecxu/dataset
自然语言处理与信息检索共享平台: