朴素贝叶斯分析
数据观察
我们的目标是判断数据中的客户哪些是可以借款的,客户的借款信用是我们判断的依据之一,可以通过朴素贝叶斯的方法来分类客户的借款信用情况。观察表格数据可知,最主要可以判断客户借款信用的主要数据包括初始评价、历史正常还款期数、历史逾期还款期数、历史成功借款金额、总待还本金。而据观察,手机认证、户口认证、视频认证、学历认证、征信认证、淘宝认证等数据,并不影响客户的借款信用。
分析思路
评价从高到低分别有A、B、C、D、E、F共6个等级,我们可以将其转化成分值段,分别对应着180~151、150~121、120~91、90~61、60~31、30~0,借款成功的概率(不保留小数部分)范围就分别为100%~84%,83%~67%,66%~51%,50%~34%,33%~17%,16%~0。
而我们将初始评价取分值段的中间值,即A、B、C、D、E、F分别对应着165、135、105、75、45、15,则初始的借款成功概率(不保留小数部分)分别为92%、75%、58%、41%、25%、9%,记借款成功的事件为o;
将历史逾期还款期数除以历史所有还款期数(即历史正常还款期数与历史逾期还款期数之和)算出逾期还款概率,这里将逾期还款事件记为a,则1-P(a)即为及时还款概率,这里记为P(b),记及时还款事件为b;