目录:
5.1 描述性统计分析
(1)基本统计学概念
- 总体
- 样本
(2)统计量
可以在一定程度上反应总体的特征,从样本数据中计算得到,常见统计量包括:
- 均值
- 标准差
- 中位数
- 分位数
- 众数
(3)离散程度
统计量可以对数据有个大体的认识,仅反应了数据的某些趋势,常见的离散程度有:
- 极差
- 四分位差
- 方差
- 变异系数
import pandas as pd
import os
os.chdir(r'C:\Users\Administrator.DESKTOP-0L8IC5U\Desktop\数据分析\data')
insuance = pd.read_csv('train.csv', encoding='utf-8', dtype={
'Gender': 'str'})
a = insuance['Age'].mean()
b = insuance['Age'].std()
c = insuance['Age'].median()
d = insuance['Age'].quantile([0, 0.05, 0.25, 0.5, 0.75])
print(a, '\n', b, '\n', c, '\n', d