聊聊数据分析的权重思维:找女票身材 > 相貌 > 涵养?


公众号后台回复“图书“,了解更多号主新书内容

作者:小z

来源:数据不吹牛

实际分析工作和生活中,经常会遇到各种权重问题:

  • 想计算一个销售综合增速得分,那2019年增速和2020年增速分别赋权多少合适?

  • 用户和商品互动有多种形式,如果要构造一个商品综合互动指数,浏览、收藏、加购、支付这些行为分别对应的权重是多少?

  • 要找女朋友,相貌、身材、涵养、家庭背景重要度应该怎么量化排序?

今天我特意肝了篇文章,给大家介绍几种常见又简单粗暴的权重确定方法。

艺术确定法

艺术确定法,顾名思义,乃拍脑袋确定法。

之所以称之为艺术,是因为它内部不确定性像艺术一样抽象。且艺术程度,会随着使用者工作年限和级别的不同而不同。

拿文章开头“想计算一个销售综合增速得分,2019年增速和2020年增速分别赋权多少合适?”的问题来说。

实习生:数据量太有限了,从重要度来说,我觉得19年增速权重可以是0.4,20年权重可以是0.6

业务:你觉得?那为什么19年权重不是0.38,20年权重不是0.62?不要什么都这么主观!

高级分析:上次类似的业务场景,我们给19年的增速赋权是0.3,20年增速赋权0.7,我觉得业务场景没有发生本质变化,可以沿用。

业务:有点道理,也许可以凑合着用。

BOSS:基于我的多年行业经验和二八法则等经典理论,我认为,19年和20年增速的权重,分别是0.2和0.8。既是经典理论的实战运用,又是我们不念过往辉煌,一心向前,只看重最近增长速度的力证。

业务:老板牛逼!老板就是老板!老板不愧是老板!

权值因子判表法

权值因子判表法,也是属于主观赋权法的一种。

和艺术确定法相比,这种方法在专家意见、多方权衡和相对量化几个方面有一定的优势,结论可信度也更强。

举一个具体的案例:

要找女朋友,相貌、身材、涵养、家庭背景重要度应该怎么量化排序?

数据不吹牛婚恋公司召集了最最最权威的4个情感专家,要通过权值因子判表法来解决这个问题。

首先,结合背景的3个考量维度,为每个专家制定判别表:

接着,把每个表分发至专家,让其独立完成打分。打分逻辑很简单,用行的属性和列的属性做比较,如果认为行属性比对应的列属性更重要,则填上1,否则填0。

这些属性不会和自身相比,所以对角线一栏是空值,我们重点对右上角区域进行打分,因为左下角的打分直接是右上角的逻辑对称(但也会参与计算)。

比如认为相貌比身材重要,打1分,身材对应的肯定没有相貌重要,在身材和相貌对比的单元格,打0分。

根据专家1的打分表,显而易见:

  • 相貌比身材重要,相貌没有涵养和家庭背景重要

  • 身材自然也没有涵养和家庭背景重要

  • 而涵养比家庭背景重要

综合来看,专家1认为,涵养 > 家庭背景 > 相貌 > 身材。

其他专家打分也是一样的逻辑,打完分后我们行向求和,得到每位的分值汇总:

最后,结合4位专家的打分,求平均值,例如相貌平均分:


其他平均分逻辑完全一样:

由于权重之和一般是1,计算各属性对应的权重,用其平均得分 除以 平均得分之和即可:

从不吹牛请的这4位专家角度来看,找女票,涵养 > 身材 > 相貌 > 家庭背景。

“这专家一点都不专业!看来权值因子判表法,在专家选择上,非常重要!”软饭硬吃的小A愤愤不平。

变异系数法

讲了两个常见的主观赋权法,再聊聊客观赋权法中,比较常见和易于理解的变异系数法。

变异系数法的核心,是用数据波动来确定权重。变异系数的计算很简单,就是用标准差 除以 平均值,变异系数越大,则数据的偏离程度越大。

变异系数法的思想中,某个指标偏离程度越大,说明该指标难以实现,是反应所评对象差距的关键指标,应赋予更高的权重。

我们拿到了一份成绩单,如何通过变异系数法来确定各科的权重呢?

先计算各科目的平均数、标准差,在此基础上计算变异系数:

然后求各科变异系数值的占比,即为权重:

例:语文权重 = 0.18 / (0.18 + 0.17 + 0.21 +0.19)

这样,我们通过变异系数法,求得了各科的权重,也知道了英语成绩是这次拉开差异的主要科目。

篇幅有限,小z讲了几个基础的权重确定方法,想做更多了解,还有层次分析法、德尔菲法、优序图法、熵值法等方法。当然,不要被这么多方法所迷惑,了解对应的使用场景和优缺点,适合业务场景的才是最好的。

◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
猜你喜欢
● 卧槽!原来爬取B站弹幕这么简单● 厉害了!麟哥新书登顶京东销量排行榜!● 笑死人不偿命的知乎沙雕问题排行榜
● 用Python扒出B站那些“惊为天人”的阿婆主!● 你相信逛B站也能学编程吗

觉得不错,点个在看吧????

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值