对鸢尾花识别之Keras
任务目标
对鸢尾花数据集分析建立鸢尾花的模型利用模型预测鸢尾花的类别环境搭建
pycharm编辑器搭建python3.*第三方库
numpypandassklearnkeras处理鸢尾花数据集
了解数据集
鸢尾花数据集是一个经典的机器学习数据集,非常适合用来入门。鸢尾花数据集链接:下载鸢尾花数据集 鸢尾花数据集包含四个特征和一个标签。这四个特征确定了单株鸢尾花的下列植物学特征:
花萼长度花萼宽度花瓣长度花瓣宽度该表确定了鸢尾花品种,品种必须是下列任意一种:
山鸢尾 Iris-Setosa(0)杂色鸢尾 Iris-versicolor(1)维吉尼亚鸢尾 Iris-virginica(2)数据集中三类鸢尾花各含有50个样本,共150各样本
下面显示了数据集中的样本:
机器学习中,为了保证测试结果的准确性,一般会从数据集中抽取一部分数据专门留作测试,其余数据用于训练。所以我将数据集按7:3(训练集:测试集)的比例进行划分。
数据集处理具体代码
# 读取数据集iris = pd.read_csv("iris.data", header=None)# 数据集转化成数组iris = np.array(iris)# 提取特征集X = iris[:, 0:4]# 提取标签集Y = iris[:, 4]# One-Hot编码encoder = Label