数据研究之综合评分(一) 权重-评分-指标

本文探讨了在大数据背景下,如何通过评分机制和权重分配来处理多维度、多类型的数据,以实现更有效的数据理解和比较。文章以城市GDP为例,介绍了评分的计算方法,并详细解释了如何使用权重来计算综合评分,以及如何在多级分类中应用这一概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:

大数据火热的背景下,数据的深层次挖掘成了一个热门的话题,单一类型的数据.只需要看不同年份数值,即可以明白其含义,然而很多时候研究方向是多维度,多类型的数据,这个时候,无法在一张图表上更好的展示.这个时候就引入了评分机制,人为的为数据打分,然而不同类型的数据是无法互相影响的,这个时候我们就引入了权重这个概念.

评分:

什么是评分?

以城市的GDP为例,2015年广东的GDP有7.2万亿(全国最高),2015年西藏的GDP有0.1万亿(全国最低),这个时候我们就需要确定好最高得分例如10分,最低得分1分,并确定好具体GDP与得分之间的关系,自定义算法(不一定是等比关系,但一定是正比关系),算出其他省份的得分,以此类推,可以计算例如人均GDP,GDP增速,人数,人口增长等一系列的数据评分.

注:得分的对比需要是同一纬度,例如省与省之间的对比,不要省与市之间进行对比

综合评分和权重:

什么是权重和综合评分?

以广州为例,假如其GDP的评分为9.5分,GDP增速评分为8分,人口增长评分为9分

这个时候我们需要知道其综合评分,我们给GDP 权重占比50%  GDP增速 权重占比30% 人口增长 权重占比20%

注意,权重比之和最好是100%

我们可以计算出其综合评分为9.5*50%+8*30%+9*20%=8.95分

分类和指标:

在数据研究当中,数据类型繁华多样,但是在研究当中,我们往往会把具有同一共性的数据类型打上同一属性的标签

例如:土地总量,土地人均供应量,工业用地,商业用地,住宅用地都可以划分为 土地数据 这一个分类

        常住人口数,人口流出数量,人口流入数量,人口密度  都可以化作 人口数据这一个分类

分类可以不止一级,只是最后一级就是我们的具体指标:如常住人口数,土地总量这样具有具体意义的数据

分类下综合评分的计算:

例:土地数据  下有  商业用地,住宅用地两个指标项 其中商业用地 权重占比为30% 住宅用地 权重占比为70%

     人口数据  下有   常住人口数,人口密度两个指标项 其中常住人口数 权重占比为60% 人口密度权重占比为30%

   对于综合评分来说  土地数据 权重占比40%  人口数据 权重占比60%

其综合评分=(商业用地评分*30%+住宅用地评分*70%)*40%+(常住人口数评分*60%+人口密度评分*30%)*60%

如果有更多级的分类,其算法也是一致的,但是需要注意的是每一级具体分类下的子指标(或分类)的权重占比之和为100%

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值