1.可用的数据集:
Kaggle网址:https://www.kaggle.com/datasets
UCI数据集网址:https://archive.ics.uci.edu/ml/index.php
2.scikit-learn----传统机器学习算法工具
中文文档:https://www.cntofu.com/book/170/docs/80.md
安装过程:
-
安装Python
首先,我们需要安装Python,并最终选择将Python加入环境变量中。
Python官网https://www.python.org/选择相应的版本并下载。 -
安装必要的依赖包
去网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 中去下载你所需要的如下两种包:运行Windows 命令行运行程序cmd,并将当前目录转到这两个文件所在的目录下。并依次执行如下操作安装这两个包:
>> pip install numpy-1.12.1+mkl-cp35-cp35m-win_amd64.whl
>> pip install scipy-0.19.0-cp35-cp35m-win_amd64.whl -
安装 Scikit-learn
执行如下命令安装scikit-learn机器学习库:pip install -U scikit-learn