数据的描述性统计与python实现

本文介绍了如何使用Python的pandas库进行数据的描述性统计分析,包括数据的集中趋势(众数、中位数、平均数、分位数)、离中趋势(方差、标准差、极差、平均差、四分位差、异众比率)、相对离散程度(离散系数)以及分布的形状(偏态系数、峰态系数)。通过实例展示了数据的可视化和各种统计量的计算,揭示了259人身高数据的统计特性。
摘要由CSDN通过智能技术生成

数据的描述性统计与python实现


使用pandas导入数据


导入需要的包

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
from scipy.stats import mode
import seaborn as sns
import os

更改工作目录及读取数据

os.chdir(r'C:\Users\Mr.M\notebook')
snd = pd.read_excel("作业数据.xls")

数据可视化,数据为259人的身高数据

from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
snd.height.value_counts().sort_index().plot(kind = 'bar')

身高分布直方图

数据的集中趋势


众数:出现频率最多的取值

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值