想要参加Kaggle,首先要搭建好我们的机器学习环境。
参加Kaggle竞赛的第一步,选定一个平台。目前,在数据分析方向最主流的两个平台是R语言和python,相比较之下,我更推荐大家使用Python来完成Kaggle上的竞赛。
原因主要包括以下几点:
- Python的生态系统比较完善,针对数据分析、机器学习的各个领域都有相对应的包来解决我们的问题,比如:sklearn,pandas,xgboost 等。
- Python有一些非常优秀的深度学习框架供我们选择,比如Theano,TensorFlow,Keras 等
- Python语法简单,上手速度快,能够用最少的代码解决我们的问题,让我们的主要精力放在解决业务问题而不是编程问题上。
1、操作系统选择
Windows是我们平时办公用的较多的操作系统,但是,在这里还是推荐使用Linux。Ubuntu是目前使用比较多的桌面Linux系统,各种软件的支持也比较好。