一个机器学习的小应用:鸢尾花分类
鸢尾花有很多种,我们今天具体分类三种:
1.山鸢尾:
维吉尼亚鸢尾:
变色鸢尾:
看的出来,每个都很beautiful😀,但又都不一样
然后本文数据集和部分代码来自百度飞桨平台:
https://aistudio.baidu.com/aistudio/projectdetail/449373?forkThirdPart=1
我们可以看到数据集是150行的5列的数据:
import numpy as np
from matplotlib import colors
from sklearn import svm
from sklearn.svm import SVC
from sklearn import model_selection
import matplotlib.pyplot as plt
import matplotlib as mpl #导入必要的库
#*************将字符串转为整型,便于数据加载***********************
def iris_type(s):
it = {
b'Iris-setosa':0, b'Iris-versicolor':1, b'Iris-virginica':2}
return it[s]
#将山鸢尾标为0 变色鸢尾花为1 维吉尼亚鸢尾花为2
#加载数据
data_path='/home/aistudio/data/data2301/iris.data' #数据文件的路径
data = np.loadtxt(data_path, #数据文件路径
dtype=float, #数据类型
delimiter=',', #数据分隔符
converters={
4:iris_type}) #将第5列使用函数iris_type进行转换 第五列就是种类了
# print(data) #data为二维数组,data.shape=(150, 5)
# print(data.shape)
#数据分割
x, y = np.split(data, #要切分的数组
(4,), #沿轴切分的位置,第5列开始往后为y
axis=1<