集成学习Day5 sklearn分类实例
1. 收集数据集并选择合适的特征
(1)数据集选择IRIS鸢尾花数据集,使用sklearn读取;
from sklearn import datasets
import pandas as pd
iris = datasets.load_iris()
X = iris.data
y = iris.target
feature = iris.feature_names
data = pd.DataFrame(X, columns=feature)
data['target'] = y
print(data.head())
特征解释:各个特征的相关解释:
sepal length (cm):花萼长度(厘米)
sepal width (cm):花萼宽度(厘米)
petal length (cm):花瓣长度(厘米)
petal width (cm):花瓣宽度(厘米)