1、加载相关库和数据集
- 使用的库主要有:pandas、numpy、sklearn、matplotlib、seaborn
- 使用的数据集:sklearn库中的鸢尾花数据集
import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
plt.rcParams["font.family"] = "SimHei"
plt.rcParams["axes.unicode_minus"] = False
warnings.filterwarnings("ignore")
2、数据集数据概览
2.1 数据总体概览
iris = load_iris()
print(type(iris))
print(iris)
In [1]: list(iris.keys())
Out[1]: ['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename']
2.2 使用主要信息构造DataFrame
- 使用 np.concatenate 拼接不同的数据信息
data = np.concatenate([iris.data,iris.target.reshape(-1,1