数据的描述性统计与python实现
使用pandas导入数据
导入需要的包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
from scipy.stats import mode
import seaborn as sns
import os
更改工作目录及读取数据
os.chdir(r'C:\Users\Mr.M\notebook')
snd = pd.read_excel("作业数据.xls")
数据可视化,数据为259人的身高数据
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
snd.height.value_counts().sort_index().plot(kind = 'bar')
数据的集中趋势
众数:出现频率最多的取值