一、2016年度忙碌的工作与技术积累
1.1 第一版通用信用模型:
201601 开始建模。
梳理大数据特征风控建模的过程如下:
样本:
从LDYS购买到sms中收到逾期3次以上定义为坏,从来没有收到逾期的定义为好。
特征:
细粒度搜索词、大数据用户画像(自然属性、社会属性、兴趣与需求属性)、LBS(家、公司、到访等)、各大类产品线按每1/3/6/12月做的统计衍生特征、细粒度搜索浏览等特征在性别等分类器上提取出的最后一层做稠密特征。
三大特征源,bdg的特征覆盖率86%(53.4w) 特征有9+w维, fsg的特征覆盖率100%(61.4w)特征有1000维,bdl的特征覆盖率50+%(31.6w)特征有2500维。
模型: