数据分析介绍之五——单变量数据观察之排序图和升幅图

本文介绍了在数据分析中,如何处理无固有顺序的独立变量,通过排序图和升幅图来分析职位分布,揭示大部分客户集中在少数职位的现象。举例说明了在邮件营销活动中,通过职位对应的客户数量进行排序,简化了分析过程。同时,讨论了依赖变量排序的适用性,并展示了销售分布和质量工程中帕累托图的应用,强调了这种分析方法在减少缺陷和优化过程中的价值。
摘要由CSDN通过智能技术生成

这里写图片描述
有一个与直方图和CDF有关的技术是值得了解的。 请考虑以下情况。 正在销售教科书和其他课程材料的公司正在计划一个电子邮件营销活动,以便与现有客户联系。 对于此次活动,该公司希望使用针对每个收件人职位的个性化电子邮件(以便教师将收到与其校长不同的电子邮件)。 问题是客户数据库包含大约25万个客户记录,其中超过16,000个不同的职位! 怎么办?

诀窍是按照与每个职位相对应的个人客户记录的数量对职位进行排序。 前几个记录如表2-1所示。 四列列出了职称,该职位的客户人数,所有具有该职称的客户的部分,最后是客户的累积分数。 对于最后一列,我们总结了当前和所有以前看到的职位的客户数量,然后除以客户记录的总数。 这相当于我们前面讨论的CDF。

我们可以立即看到,全部三分之二的客户只占10个不同的职位。 仅使用前30名职位就可以获得75%的客户记录。 这比我们开始的16,000个职位要容易得多!

我们再来一会儿,了解这个例子与以前见过的不一样。 这里需要注意的是独立变量没有固有的顺序。 这是什么意思?

对于Web服务器示例,我们计算每个响应时间的事件数; 因此,每个bin的事件计数是因变量,它由独立变量即响应时间决定。 在这种情况下,独立变量具有固有的顺序:100毫秒总是小于400毫秒(等等)。 但

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值