独家 | 规范性分析的实用介绍(附R语言案例研究&演示代码)

本文介绍了规范性分析的概念,并通过一个电信客户流失的案例,展示了如何运用描述性、预测性和规范性分析来解决问题。文章详细阐述了数据预处理、变量筛选、模型构建、预测和性能提升建议,旨在帮助读者理解并应用规范性分析解决实际问题。
摘要由CSDN通过智能技术生成

640?wx_fmt=png

翻译:张睿毅

校对:吴金笛

本文约4500字,建议阅读15分钟。

本文是作为Analytics Vidhya’s Internship Challenge的一部分提交的案例研究。


Analytics Vidhya’s Internship Challenge

https://datahack.analyticsvidhya.com/contest/av-internship-challenge/?utm_source=blog&utm_medium=practical-introduction-prescriptive-analytics


引言


“分析的不同分支是什么?“当我们开始分析之旅时,我们大多数人都被告知有两种类型——描述性分析和预测性分析。实际上还有第三个经常被忽视的分析——规范性分析。


处方分析是这三种方法中最强大的一种。让我用一个例子来演示一下。


640?wx_fmt=png


最近,一场致命的飓风袭击了印度的奥迪沙,但幸运的是,大多数人已经撤离。奥迪沙气象部门已经预测到了这场可怕的气旋到来,并做出了拯救生命的决定,疏散可能有危险的地区。


与1999年相比,当时有10000多人死于类似的飓风。由于没有关于即将来临的暴风雨的预报,所以他们没有意识到将发生什么。那么,发生了什么变化?


奥迪沙政府是规范性分析的受益者。他们能够利用气象部门对气旋的准确预测的服务——它们的路径、强度和时间。他们用这个来决定何时以及需要做什么来防止生命的损失。


因此,在本文中,我们将首先了解“规定性分析”这一术语的含义。然后,我们将通过进行案例研究和实施分析分支(描述性、预测性和规定性)来巩固我们的学习。我们开始吧!


目录表


  • 什么是规范性分析?

  • 设置问题陈述

  • 生成假设

  • 制定我们的模型构建方法

  • 数据可视化和数据准备–描述性分析

  • 预测客户行为-预测分析

  • 推荐提升性能—规范性分析


什么是规范性分析


我们可以将分析大致分为三个不同的部分——描述性分析、预测性分析和规范性分析。让我们来看看这些:


  • 描述性分析是任何模型构建练习的第一部分。我们对历史数据进行分析,以确定因变量和自变量的模式和趋势。这一阶段也有助于假设生成、变量转换和特定行为模式的任何根本原因分析。

  • 预测分析是分析的下一个阶段。这里,我们利用已清理和/或转换的数据,并在该数据上拟合一个模型,以预测因变量的未来行为。预测分析解决了可能发生的问题。

  • 规规范性分析是最后一个阶段,预测用于规定(或建议)下一组要做的事情。这就是我们奥迪沙政府的例子来源。他们利用气象部门的预测,采取了一系列措施,如安置低洼地区的所有人员,提前安排食物、住所和医疗救助等,以确保损失有限。


下图很好地说明了规范性分析框架下的组件:


640?wx_fmt=png


设置问题陈述


我发现学习一个主题的最好方法是实践它。所以,让我们通过一个案例研究和实现上面讨论的每个分析部分来理解规范性分析。


640?wx_fmt=png


电信运营商组织的高级管理层担心客户流失率不断上升。此外,最近的一项独立调查表明,整个行业将面临不断增长的客户流失率和ARPU(每单位平均收入)的下降。


到目前为止,留住客户的努力是非常被动的。只有当客户要求关闭他们的帐户时,我们才会采取行动。这不是一个好策略,是吗?管理团队希望在这方面采取更积极的措施。


作为数据科学家,我们的任务是分析他们的数据,获得见解,预测客户的潜在行为,然后推荐改进性能的步骤。


为我们的问题准备数据集


您可以从这里下载数据集。我还提供了我的Github存储库上的完整代码。有三个R文件,您应该按以下顺序使用它们:


  • DataPreparation.r

  • Visualization.r

  • ModelBuilding.r


假设生成


生成一个假设是解锁任何数据科学或分析项目的关键。我们应该首先列出我们试图通过我们的方法实现的目标,然后从那里着手。


客户流失是由以下因素驱动的(根据独立行业调查):


  • 成本和账单

  • 网络与服务质量

  • 数据使用连接问题


我们希望对我们的电信提供商进行同样的测试。通常,我们鼓励公司提出一套详尽的假设,以免遗漏任何变量或要点。但是,对于本文的范围,我们将把重点缩小到一个:


与成本、账单、网络和服务质量相关的变量是否对客户留下或离开服务提供商的决定做出了重大贡献?


  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值