IBM SPSS 软件家族预测分析模型的商业应用初探系列
Statistics 和 Modeler 作为 IBM SPSS 软件家族中重要的成员,是专业的科学统计、数据挖掘分析工具,其具有功能强大,应用广泛的特点。其核心 组成部分——预测分析模型,不仅是软件功能实现的关键,同时也是软件应用的关键。
Statistics 中的模型侧重于统计分析技术, 而 Modeler 则侧重于数据挖掘技术。它们都依据现有数据,运用某个或某几个特定的算法,来预测用户所关注信息的未来值。Statistics 和 Modeler 提供众多的预测模型,这使得它们可以应用在多种商业领域中:如超市商品如何摆放可以提高销量;分析商场营销的打折方案,以制定新的更为有效的方案;保险公司分析以往的理赔案例,以推出新的保险品种等等,具有很强的商业价值。
Statistics 和 Modeler 产品中含有大量基于高级数学统计算法的预测模型,为了保证算法的严密性及结果的精确性,模型往往还需要许多详细的参数设定,这样就要求用户具有一定的统计专业知识,只有理解预测模型中的各项设置及运算结果的真实意义,才有可能结合结果做出正确的决策判断;另外,为了满足不同行业用户的需求,Statistics 和 Modeler 涉及到数学领域中多个不同的范畴,即使专业用户也很难了解所有模型,从而挑选出最适合他们应用的模型。
因此,为了让更多的用户更好更准确地使用我们的产品,最大地发挥其商业价值,我们将通过一系列的相关文章来介绍 IBM SPSS 软件家族中 Statistics 和 Modeler 的典型预测模型以及他们在解决相应的商业问题中的实际应用。
本系列文章从实际问题出发,通过一些实际生活中常见的商业问题来引出 IBM SPSS 软件家族中的典型预测模型,手把手地指导用户如何在软件中对该模型进行设置,如何查看运行结果,讲解运行结果的真实意义,最后引申到如何将该结果应用于解决这个具体的商业问题中来。用这种最直观简单的方式使即使缺乏统计学背景的用户也能容易地理解这些预测模型,从而很好地使用我们的产品。 同时,文中也涉及了一定的统计知识,使具有专业知识的用户能依此线索尽可能多的了解我们的产品的方方面面,从而选择最适合他们问题的模型。
下面,我们将会陆续给大家介绍 IBM SPSS 软件家族中的 Statistics 和 Modeler 包含的典型预测模型。
商业保险理赔案例
商业保险公司经常需要受理客户的理赔要求,这些以往的理赔案例记录就构成了经验数据。保险公司希望根据经验数据分析影响理赔金额的因素,以及影响程度的定量关系, 并使其服务中心能够在处理客户理赔案例的电话交流中,在得到相关保单信息和索赔要求之后立刻预估出理赔金额,缩短理赔处理时间,从而提高其服务质量。并且通过进一步分析,为公司降低运营风险提供决策支持。
这里我们主要研究和固定资产相关的理赔案例。理赔案例数据的主要变量信息如表 1 所示。其中,测量尺度为标度测量的变量是连续型变量,测量尺度为名义测量或有序测量的变量是离散型变量。
表 1. 固定资产理赔案例数据的主要变量信息
字段名 | 含义 | 类型 | 测量尺度 |
---|---|---|---|
claimid | 理赔案例 ID | 字符串 | Nominal(名义测量) |
incident_date | 事故发生日期 | 日期 | Scale (标度测量) |
claim_type | 理赔类型 | 数值 | Nominal |
uninhabitable | 固定资产是否不易居住 | 数值 | Nominal |
claim_amount | 理赔金额 ( 千元 ) | 数值 | Scale |
fraudulent | 是否为欺诈索赔 | 数值 | Nominal |
policyid | 保险单 ID | 字符串 | Nominal |
policy_date | 投保日期 | 日期 | Scale |
coverage | 保险责任范围金额 ( 千元 ) | 数值 | Scale |
deductible | 可扣除金额 | 数值 | Scale |
townsize | 居住城镇大小 | 数值 | Ordinal(有序测量) |
gender | 性别 | 数值 | Nominal |
dob | 出生日期 | 日期 | Scale |
edcat | 受教育程度 | 数值 | Ordinal |
job_start_date | 开始工作时间 | 日期 | Scale |
retire | 是否已退休 | 数值 | Nominal |
income | 家庭收入 ( 千元 ) | 数值 | Scale |
marital | 婚姻状况 | 数值 | Nominal |
reside | 家庭成员人数 | 数值 | Scale |