Kaggle是什么??
Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的关注,这些用户资源或许正是吸引谷歌的主要因素。
- 打开kaggle,导入数据和代码可以直接打包导入或者分开导入,这都没有问题,只是需要改变数据的保存路径问题,具体操作如下图,从上到下依次点击:
- 点击复制数据的路径后就可以直接在代码中进行修改了,结果如下图:
- 一般来说,数据的路径都是在当前目录下的input文件夹下,即:''../input/文件夹数据文件''。
- 当你上传完代码和数据后,运行代码时发现没有这个模块时,可以打开下方的控制台
# 清华源镜像地址:https://pypi.tuna.tsinghua.edu.cn/simple,
# 以openpyxl为例,命令行如下
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl
# 豆瓣源地址https://pypi.douban.com/simple/
pip install -i https://pypi.douban.com/simple/ pymysql # pymysql可随意替换成其他包名
-
排错:
- 输入之后直接回车,如果报错
- 可检查kaggle的网络开关是否未打开?
- 勾选按钮之后,再次运行pip命令即可成功安装。
其实也可以在code cell中直接使用 pip命令,(针对于习惯使用 jupyter notebook而言),和jupyter操作一致,此处不再赘述。
此处,我还想提的是,以上安装无法在服务器停止后保存安装的库,Kaggle的DOC文档上给出了永久安装库包的操作,我尝试安装后发现不成功,其步骤如下:
# example package
!pip install openpyxl --target=/kaggle/working/mysitepackages
# 添加系统路径
import sys
sys.path.append('/kaggle/working/mysitepackages')
# 导入库包
import openpyxl
# 查看安装路径的安装包列表
!ls /kaggle/working/mysitepackages/
后面可能会解决这个问题,以后再补充吧!!!