Ubuntu corpus生成 github库:https://github.com/rkadlec/ubuntu-ranking-dataset-creator 1、按照提示clone到本地服务器 2、重点是py3运行py2的代码:打开仓库的issues,里面有提示; 3、下载p3-diff.py文件,按照下方提示操作即可。 4、./generate.sh -t -s -l 运行;时间会很长,因为要下载数据压缩包及生成三个csv文件。