数据的集中趋势主要包含均值(一般均值、截尾均值、缩尾均值、几何平均数、调和平均数)、中位数、分位数、众数。
这里尝试用可视化方法取得以上数值。
除了部分输入对话框需要键盘输入数值,其余都用鼠标完成。
部分运算结果:
df_cars.dist 众数:
ModeResult(mode=array([26], dtype=int64), count=array([4]))
df_cars.dist 几何平均数:
34.326147962734844
df_cars.dist 调和平均数:
22.182142726578665
df_cars.dist 中位数:
36.0
df_cars.dist位于分位点 [10,20,25,50,75,100] 的分位数:
[ 15.8 21.6 26. 36. 56. 120. ]
数值:55 在 df_cars.dist 中的分位点:
72.0