文章目录 1、加载相关库和数据集 2、数据集数据概览 2.1 数据总体概览 2.2 使用主要信息构造DataFrame 2.3 构造后的数据概览 3、使用相关函数进行描述性统计分析 3.1 频率和频数分析 3.2 数据的集中趋势分析 3.3 手动计算分位数 3.4 数据的离散程度分析 3.5 数据的分布形状分析 1、加载相关库和数据集 使用的库主要有:pandas、numpy、sklearn、matplotlib、seaborn 使用的数据集:sklearn库中的鸢尾花数据集 import pandas as pd import numpy as np from sklearn.datasets import load_iris import matplotlib.pyplot as plt import seaborn as sns import warnings plt.rcParams["font.family"] = "SimHei" # 设置可以显示中文字体 plt.rcParams["axes.unicode_minus"] = False warnings.filterwarnings("ignore") # 忽略警告信息 2、数据集数据概览 2.1 数据总体概览 iris = load_iris() # 加载鸢尾花数据集 print(type(iris)) print(iris) In [1]: list(iris.keys()) Out[1]: ['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'] 2.2 使用主要信息构造DataFrame 使用 np.concatenate 拼接不同的数据信息 # 拼接data信息和target信息,用于构造DataFrame data = np.concatenate([iris.data,iris.target.reshape(-1,1