[导读]本文选自百融金服CEO张韶峰和CRO季元于2017年9月14日晚在清华大数据“技术·前沿”系列讲座——大数据与AI技术在金融科技的应用上的分享。两位学长结合自己在金融行业和金融科技领域多年的探索,结合金融领域的反欺诈、信用风险识别、不良资产催收、精准营销等业务场景,深入浅出地阐述对抗生成网络、迁移学习、强化学习等方法的金融行业建模实践。
后台回复关键词“0914”,下载完整版讲座PPT。
百融金服CEO张韶峰
百融金服CRO季元
张韶峰:首先非常激动能够回到母校跟各位校友,还有各位朋友,来分享这次报告。我们进入到金融科技领域是2012年,我们最早跟银行交流,想推动我们公司用机器学习算法作为模型在银行应用,银行那时候习惯运用的算法叫逻辑回归算法(Logistic regression algorithm),是一种比较简单的算法。但是我坚定地认为数据有用,至于有什么用,其实想不清楚,只是后来遇到金融行业的大爆发、变革,才发现数据在金融领域的应用那么直接。
金融领域一个非常重要的支柱就是信用体系。中国还有七八亿有金融需求的人没有信用记录,这是制约中国所谓普惠金融,刺激小微企业发展、消费发展,这是属于基础设施的问题。
大数据应用分层
从大数据行业来看,有些是共通的。
第一步,收集数据。
第二步,数据处理。把数据进行标准化,清洗脏数据、不准的数据,或者做一些脱敏。
第三步,数据降维。如果表格的每一行是一个用户,一个表的列数多达50万列,这是非常庞大的一个维度,处理起来会导致效率下降,需要做一些数据的降维,需要做一些衍生变量。
第四步,数据建模。金融里有两个模型最重要:第一类是营销获客模型,预测什么人需要什么样的金融服务,主要是预测客户的需求。第二类是风控模型。
第五步,大数据应用。不同的行业做的应用不同。
金融行业可以在哪些方面具体使用呢