作者: 汪京 (上海交通大学)
邮箱: wang_jing20@163.com
1. 简介
直方图是一种统计图表,用于表示数据的分布情况。它通过将数据分组到连续的、不重叠的区间 ( bin ) 中,并用柱状图的形式来展示每个区间内数据的数量或频率。直方图可以帮助我们理解数据的分布特征,比如数据的集中趋势、离散程度和偏态等。通过直方图,我们可以快速地识别数据的分布模式,比如正态分布、偏态分布或多峰分布等。
在实证分析中,有时我们需要比较不同变量或同一变量不同样本的分布,这可以通过绘制多变量直方图来实现。而在 Stata 常用的绘制多变量直方图命令 twoway (histogram x) (histogram y)
中,变量 x 和 y 的直方图中的组距往往不同 ( 即 bins 并不对齐 ) 。 Michael Droste 开发了多变量直方图绘制命令 multihistogram
,该命令支持绘制设定相同组距 ( bins 统一 ) 的多变量直方图。下文将对该命令做介绍与使用示范。