我们老师说,有了什么进展或者解决什么问题之后,一定要写一个博客,这个博客不是为别人看的,而是为自己看的,因为如果不记下来,以后就会慢慢忘掉,今天上午和昨天晚上我都在犯愁下载文件的问题,因为网络不稳定,文件下载了好多次还是失败,再加上昨天我的xshell到期了,SSH client中文报错总是乱码,我难受了好一阵,还好昨晚通过伟大的知乎发现了一款好用免费的连接服务器的程序:MobaXterm,虽然我总记不住它的名字,不过他真的太好用了!好了言归正传,我写这篇博客是为了记录Linux下载kaggle文件时遇到的问题。
我要下载的是yelp数据集,那是2.9G的数据集。一开始为了方便起见,我是打算直接在官网上下载到本地Windows10,结果下载到2.2G的时候,突然被拒绝了,我也不知道为什么,之后尝试了好几次都直接被拒绝。后来发现了Kaggle网站上也有我想要的数据,后来我就尝试直接下载到本地,可是因为WiFi信号太不稳定,下载不下来,终于我想通了,直接下载到服务器上,所以就上网查怎么用Linux命令行下载网页中的文件。
一种方法是用wget+url,但是这种方法不适用于kaggle网站数据的下载,所以我又上网查,发现还有一种curl的方法:
- 使用Google浏览器,按F12或者鼠标右键打开检查,在上面的栏目中选择“network”