经济学上的基尼指数
首先我们来理解基尼系数的含义
什么是基尼系数?
在经济学中,基尼系数是用来衡量一个国家或地区居民收入差距的常用指标。
我们先来看一个收入分配绝对平等的高度理想状态:
图中的曲线称为洛伦兹曲线,横坐标表示累计人口百分比,纵坐标表示累计收入百分比。
当累计人口百分比和累计收入百分比成1:1的线性关系时,洛伦兹曲线为一条直线,
此时表示前20%的人获得20%的收入,前40%的人获得前40%的收入......而这种绝对平等的状态在现实生活中是不可能存在的。
接着我们来看现实一点的情况:
中间的洛伦兹曲线表示前50%的人获得25%的收入,后50%的人则获得75%的收入,这显然是不平等的!
此时,基尼系数就是用来量化洛伦兹曲线内凹程度的量!
从几何意义上看,基尼系数为A的面积除以A+B的面积。
基尼指数越向内凹,表示收入分配越不平衡,贫富差距也就越大。
基尼系数最大为“1”,最小等于“0”。 “1”表示收入分配极端不平衡;“0”表示收入分配绝对平等。
国际上把基尼系数=0.4设为警戒线,基尼系数超过0.5的情况称为贫富差距悬殊。
决策树中的基尼系数
聊完了基尼系数的经济学含义,我们来看看基尼系数的计算方法:
先给出公式,再慢慢解释~
在构造决策树时,基尼系数一般也称基尼不纯度(Gini Impurity)
顾名思义,此时的基尼系数用于反映样本集合中数据的纯度,
表示在样本集合中一个随机选中的样本被分错的概率。
基尼系数的值越小,纯度越高
我们来看一个例子:
假设有一个钱袋子(样本集合),装有人民币(样本数据)。每一位居民只能在钱袋子里拿一次钱,一次一张
当钱袋子(样本集合)里有且仅有1元的人民币时,每位居民拿到的钱都是1元,此时收入绝对公平,基尼系数=0;
当钱袋子里混入了一张2元人民币时,收入就出现了不公平:
设拿到1元人民币的概率为p1,拿到2元人民币的概率为p2,
此时,我们要计算基尼系数,也就是计算样本数据的不纯度,
我们定义基尼系数为 样本被选中的概率*样本被分错的概率
在这个例子中,基尼系数即p1(1-p1)+p2(1-p2) 5/6 * 1/6 + 1/6 *5/6 = 5/18 = 0.277
关于先富带后富、共同富裕的感想
最近中特课上正好讲到吴仁宝老书记带领的华西村的故事,
“每家都有一栋400-600平米的别墅。每个家庭都有100-500万元的存款,或者高达几千万元的资产和一到三辆车,2003年到2004年村民人均收入超过8000美元,是全国农村最高的......”
华西村无疑是实现共同富裕的一个完美集体主义典范。
吴仁宝老书记采用的分配制度以平均分配为主,与我们现行分配制度的原则相抵触。
我们所提倡的 先富带后富最终实现共同富裕 是十分美好的愿景和希望,但规则的制定者往往是上层社会的精英,很难不考虑自身群体的利益,先富带后富必然会拉开我们的贫富差距。
贫富差距大,普通老百姓的剩余价值被万恶的资本主义压榨,阶级矛盾就显露了
身在社会主义国家,我们还是很幸运的,国家做了很多举措来平衡经济,南水北调等等
希望国家的经济建设能稳步发展,加大对贫困地区的扶持力度,尽量控制好基尼系数,得到群众的支持与拥护!