Python中的统计数据展示
1、数据可以分为“分类型”或“数值型”,如果变量是数值型的,我们就采用某些特定的统计方法,相反,如果数据是定性分类的,那么我们可以采用另外的办法,
1.1、分类数据
①布尔数据
②名义数据
③等级数据(有序变量)
1.2、数值型数据
①连续的数值型
②离散的数值型
2、函数式和面向对象式的绘图方法
2.1、首先考虑pyplot风格
3、统计图形
3.1、散点图
散点图是单变量数据最简单的展示方法,只要绘制出每个单独的数据点即可,
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import scipy.stats as stats
import seaborn as sns
#生成数据
x=np.random.randn(500)
#绘图命令
plt.plot(x,'.')
plt.show()
3.2、直方图
直方图提供了一个数据分布的一个很好的概览,如果你除以总的数据点个数,即可得到相对频率的直方图,如果你是每个区间的顶部中间点连接起来,你会得到一个相对频率的多边形。
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import scipy.stats as stats
import seaborn as sns
x=np.random.randn(500)
plt.hist(x,bins=25)
plt.show()
3.3、核密度(KDE)估计图
直方图有一个缺点就是它不是连续的,并且它的形状严格取决于区间的宽度,为了获得平滑的概率密度,也就是说描述一个事件在给定区间内被发现的可能性,我们就可以使用核密度估计的方法,因此,正态分布被用作典型的核,核密度的宽度决定了平滑的程度。
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import scipy.stats as stats
import seaborn as sns
x=[-2.1,-1.3,-0.4,1.9,