本文作者为永洪科技高级咨询顾问
在O’reilly举办的2017年AI Conference上,吴恩达做了主题为“AI is the new electricity”的演讲。在演讲中吴恩达表示:“AI的崛起正改变着企业间的竞争力。”然而,众多企业受限于自身的技术能力,从而在同行业中缺乏核心竞争力。
永洪科技作为大数据领域领军企业,旗下Yonghong Z-Suite套件包含具备AI能力的深度分析模块,目前已经支持90%以上的常用算法,到2017年底将支持95%以上的常用算法。截至目前,已有不少客户已经在这一平台上开展自己的AI工作,并取得了一定的成果。
要对数据进行更深度地应用,需采取深度分析算法(或数据挖掘算法),通过机器内部的算法自动对数据规律进行运算,并对结果进行预测,该算法不预先对数据的分布和变量间关系做假设。如果说BI是“告诉你已知的”,那么具备AI能力的深度分析应用将“告诉你未知的”。
永洪科技在9月19日发布了永洪一站式大数据分析平台最新版本Yonghong Z-Suite V7.5,该版本不仅具有新一代敏捷BI的所有功能,同时也具备出色的深度分析模块,为企业提供完整的数据分析能力。下面为大家简单介绍永洪深度分析模块中的两种预测算法:
一. 逻辑回归分析
业务场景如下:业务人员想对手中的客户进行管理,他想预测哪些客户可能会流失,从而制定挽留策略。目前客户的历史数据字段如下:account length(账号)、total day minutes(白天通话时长)、total day calls(白天通话次数)、total day charge(白天通话费用)、total eve calls(傍晚通话次数)、total eve charge(傍晚通话费用)、total night calls(夜晚通话次数)、total night charge(夜晚通话费用)、total intl minutes(夜晚通话费用)、customerleft(夜晚通话费用)等。
业务人员可以在BI平台利用不同维度和度量的组合,从而构建类似如下分析模型:
图1:话务分析
由图1的话务分析模型,我们可以看到不同客户通话费用及通话次数排名,也可以看到某个客户的通话次数情况,以及重点监视排名靠后的客户。通过分析我们发现,虽然排名靠后的客户通话产生的话费较少,但是通话次数可能较多、粘度较高,从而无法判断其是否流失。此时,逻辑回归算法将会发挥巨大价值。逻辑回归算法专门解决因变量为分类变量的问题,如上面所提的客户流失的“是”与“否”问题。那么如何利用永洪的深度分析模块实现对客户流失的预测?
-
把原有数据(churn-train)纳入逻辑回归分析模型,构建分类器:
图2中的“数据分区”将会把原有数据churn-Train按照设定的比例分成训练集和验证集,其拟合效果如下:
图3:ROC曲线
由图3的ROC曲线可以看到,训练集和验证集的AUC值均大于0.7(值域为0~1),表示拟合效果良好,因此该逻辑回归模型可用。 -
把新数据(churn-test)纳入已经建立好的逻辑回归模型进行匹配,从而预测客户未来流失情况:
图4
点击图4的“评分“,即可以看到对客户的流失的预测结果:
图5:预测结果
由图5的预测结果可以看到,逻辑回归分析模型把新客户进行分类预测(流失=1,不流失=0),并给出相应的概率(见“概率”和“类”两个字段)。由此业务人员就可以得知哪些客户可能会流失,并执行相应的挽留策略。
接下来,我们继续介绍Yonghong Z-Suite V7.5中的时序预测算法。
二. 时序预测
时序预测:通过时间序列,对某个值进行预测。
考虑如下场景:通过趋势线,财务人员已经得知往年的成本支出情况,但他更想知道未来一年的成本支出是多少,以便调整成本预算。
图6:成本趋势统计
由图6的成本趋势统计中,我们可以看到2009-2010年的成本支出情况,那么有没有办法获取2011年的成本支出情况呢?永洪深度分析模块的时序预测算法可满足此需求。通过把时间序列和要预测的字段纳入时序预测分析模型,即可对未来一年的成本支出进行预测:
图7:成本预测
由此,财务人员可以根据成本预测图,及时调整成本预算。
通过上述两种算法的介绍,让我们能够对数据进行深度应用。那么其学习成本会不会很高,操作会不会很难?不用担心,永洪科技一直以来贯彻“自服务分析“理念,操作简易,上手快。经过简单培训后,即可通过拖拉拽的方式构建深度分析模型。以逻辑回归分析为例:
- 提供参考样例,引导快速构建分析模型:
- 通过拖拉拽的方式和简易友好界面,进行参数配置:
怎样?数据深度分析是不是并没有你想象得那么难。利用Yonghong Z-Suite 平台,快速构建数据深度分析模型,提高企业竞争力。