数据集描述
鸢尾花数据集:是机器学习和统计学中的一个经典数据集,数据包含每朵鸢尾花花瓣的长度和宽度、花萼的长度和宽度以及每朵花对应的种类,还有对数据的一些说明、种类名、特征名。
数据集获取
from sklearn import datasets
from pandas import DataFrame
import pandas as pd
# .data返回iris数据集所有输入特征
x_data = datasets.load_iris().data
# .target返回iris数据集所有标签
y_data = datasets.load_iris().target
# print("x_data from datasets: \n", x_data)
# print("y_data from datasets: \n", y_data)
# 为表格增加行索引(左侧)和列标签(上方)
x_data = DataFrame(x_data, columns=['花萼长度', '花萼宽度', '花瓣长度', '花瓣宽度'])
# 设置列名对齐
pd.set_option('display.unicode.east_asian_width', True)
print("x_data add index: \n", x_data)
# 新加一列,列标签为‘类别’,数据为y_data
x_data['类别'] = y_data
print("x_data add a column: \n", x_data)
x_data.to_excel('iris.xlsx',index=False)
x_data.to_csv('iris.csv',index=False)