sklearn.datasets.fetch_20newsgroups下载报错的问题

先说此过程遇到的错误都有哪些?
第一个错误:

forbidden 403

第二个错误:
明明路径是正确的,但是报这个错

No such file or directory

第三个错误:

EOFError: Compressed file ended before the end-of-stream marker was reached

这个是因为第一次直接从外网下载时那个压缩包内容不完全导致的。

如何解决
第一步,手动下载正确的安装包,很多文章给的链接已经失效,最终重新找到一个可以用的链接

https://ndownloader.figshare.com/files/5975967

第二步,在我的电脑 C:\Users(你的user_name)\scikit_learn_data\20news_home 目录下,将下载好的压缩包拖进去(如果之前没有的需要自己手动创建)
第三步,通过D:你的项目下\venv\Lib\site-packages\sklearn\datasets找到其中的 twenty_newsgroups.py,打开进行如下的修改
在这里插入图片描述
将红框的地方内容注释掉,并且添加

    archive_path = "C:/Users/Judy/scikit_learn_data/20news_home/20newsbydate.tar.gz"
    logger.debug("Decompressing %s", archive_path)
    tarfile.open(archive_path, "r:gz").extractall(path=target_dir)
    os.remove(archive_path)

注意:archive_path是刚才放那个压缩包的路径
至此,便可以再次运行程序,可以成功运行
压缩文件变成了在这里插入图片描述
查看输出内容
在这里插入图片描述

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值