客户流失预测模型通常采用Logistic回归方法来建立。Logistic回归模型预测目标变量出现某一类别值的概率,比如说,预测客户流失(目标变量值为1)的概率,或者预测客户不流失(目标变量值为0)的概率。简单来说,Logistic回归模型最后将会训练得到如下的模型公式,再用这个公式对客户进行评分,得到相应的概率值。
或
可现在的问题是,通过上述模型公式,我们将得到一个概率值,那么这个概率值到底表示什么呢?是表示客户流失的概率,还是客户不流失的概率?如果不仔细分析,就会认为,这得到的概率值就是表示客户流失的概率。其实,这是不对的。因为,使用Logisric回归方法建模,需要在建模之前做一个很重要的假定:p=p{y=1}=p{客户流失}。基于这样的假定,我们就可以判断最后得到的概率值是指客户流失的概率。当然,也可以做这样的假设:p=p{y=0}=p{客户不流失}。这时得到的概率值将是客户不流失的概率。
那么关于这一点,SAS软件又是如何处理的呢?Logistic过程可用来建立Logistic回归模型,其中所涉及到这方面处