前言
学习机器学习,准备使用kaggle网站的数据集,并学习其中案例,踩到一些坑,记录如下,方便自己,也能为其他入行者提供借鉴。
新用户注册Captcha must be filled out问题
以下地址下载chrome浏览器扩展插件Header Editor.crx
链接: https://pan.baidu.com/s/1XZyS2TYE1MA6BHwwe1C-_A 提取码: ixfi
打开chrome浏览器的扩展程序管理界面
可以直接输入chrome://extensions/来打开扩展程序管理界面
拖动到扩展程序管理界面安装
输入下面地址打开插件配置界面
chrome-extension://eningockdidmgiojffjmkdblpjocbhgh/options/options.html
以下地址下载HE-GoogleRedirect.json配置文件
链接: https://pan.baidu.com/s/1jJ3Idbjcjsl3qmcWI5GKBw 提取码: 6if6
导入配置文件即可,详情可以参考文章后的参考文件。
数据集无法下载问题
网页点击无法下载,尝试hosts配置,无法解决
尝试kaggle的api方式
1 先在python3 下安装kaggle
pip3 install kaggle
- 然后,去到kaggle网站获取token,将json文件移动到c盘/用户/.kaggle文件夹下,没有的可以自行创建,但是不能直接创建带点开头的文件,这时候可以 命名为kaggle,然后文件地址栏输入cmd,打开cmd输入:
ren kaggle .kaggle
即可创建.kaggle目录
接下来,只需要将json文件拷贝到./kaggle目录即可
3 记得去掉配置的不灵的hosts文件,不然依旧无法下载
4 到kaggle网站复制API命令,再加上-w --unzip(自动下载并解压)
kaggle datasets download -d arshid/iris-flower-dataset -w --unzip
可以正常下载
经验总结
1 后面下载却又链接超时,折腾半天,啥也没改,最后竟然又可以了,所以遇到下载问题记得不断尝试或者换个网络环境再尝试
参考链接
参考链接
https://blog.csdn.net/weixin_45472361/article/details/127889457