先说此过程遇到的错误都有哪些?
第一个错误:
forbidden 403
第二个错误:
明明路径是正确的,但是报这个错
No such file or directory
第三个错误:
EOFError: Compressed file ended before the end-of-stream marker was reached
这个是因为第一次直接从外网下载时那个压缩包内容不完全导致的。
如何解决
第一步,手动下载正确的安装包,很多文章给的链接已经失效,最终重新找到一个可以用的链接
https://ndownloader.figshare.com/files/5975967
第二步,在我的电脑 C:\Users(你的user_name)\scikit_learn_data\20news_home 目录下,将下载好的压缩包拖进去(如果之前没有的需要自己手动创建)
第三步,通过D:你的项目下\venv\Lib\site-packages\sklearn\datasets找到其中的 twenty_newsgroups.py,打开进行如下的修改
将红框的地方内容注释掉,并且添加
archive_path = "C:/Users/Judy/scikit_learn_data/20news_home/20newsbydate.tar.gz"
logger.debug("Decompressing %s", archive_path)
tarfile.open(archive_path, "r:gz").extractall(path=target_dir)
os.remove(archive_path)
注意:archive_path是刚才放那个压缩包的路径
至此,便可以再次运行程序,可以成功运行
压缩文件变成了
查看输出内容