鸢尾花的分类是python机器学习中比较经典的一个入门式教学课程,
属于监督学习算法
包括四个方面,训练,测试,评估,预测
此次记录也适合从这四个方面出发
一:训练
利用已知的鸢尾花数据构建机器学习模型,用于预测新测量的鸢尾花的品种。
鸢尾花的数据哪里来呢?有一个开源项目叫做sciket-learn,里面有鸢尾花的150个数据集。
1.1安装sciket-learn
pip install sciket-learn
1.2安装必要的工具和库文件
pip install numpy scipy matplotlib ipython pandas
直接使用命令安装上述都是默认安装最新版本的软件,我这里安装完之后的版本分别是:
pandas:0.23.4 修改和操作表格的
matplotlib:2.2.3 将数据绘制成图像的
Numpy:1.15.2 用来科学计算的,就是将数据变换成自己想要的格式
SciPy:1.1.0 功能和Numpy差不多
IPython:5.8.0 另一个python平台,不知道干嘛的
scikit-learn:1.1.0 导入鸢尾花数据的
1.3分配数据
上代码:
#coding