权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。而在我们的数据分析过程中,倘若各个指标的重要程度不同,则我们便需要对我们的指标数据赋予一定权重。
指标权重的选择,直接影响评价指标体系的公正性及预测的准确性,因此指标权重的确定更需要讲究客观性。今天就为大家介绍一种数据分析中常用的赋值法——熵值权重法,同时,我也将结合实例为大家讲讲如何用python实现熵值法。
(1)熵值权重法的理论基础
在信息系统中的信息熵是信息无序度的度量,信息熵越大,信息的无序度越高,其信息的效用值越小;反之,信息熵越小,信息的无序度越小,信息的效用值越大.
因此可以运用信息熵评价所获系统信息的有序程度及信息的效用值.在评价体系中,指标的信息熵越大,则其信息的效用值越小,因此赋予该指标较小的指标权重;指标的信息熵越小,则其信息的效用值越大,因此赋予该指标较大的指标权重.
(2)熵值权重法的计算步骤
(由于有些公式需要借助mathtype编辑,因此我们的计算步骤会先在word里编辑,然后通过图片的方式放到文章里)
<