数据分析报告撰写
———手机APP数据
背景介绍
2015年1月5日,人民银行批准八家机构进行数据的收集。此后,中国个人征信行业进入高速发展期,征信人口覆盖率达50%,每人每年查询个人征信报告的次数为5,查询服务单价为25元,从而,征信市场未来规模约855亿元。什么是征信?简单而言,市民小强买新出的BMW,问题钱不够,便找银行贷款。银行找来帮手——征信机构,征信机构根据小强在日常消费、事业单位、相关政府部门中的个人基本信息、支付、借还款等信息,对小强进行征信评分或评级,这就是征信的基本内容。如下为征信流程:
征信发挥着重要基础作用。征信降低了交易中存在参与双方信息不对成而带来的交易风险,从而起到风险判断和揭示的作用。同时,征信促成信用交易的达成,促进金融信用产品和商业信誉产品的创新,在互联网飞速发展下,有效矿大信用交易的范围和方式,带动信用经济规模的扩张。征信将信息价值最大化,通过专业化的信用信息的服务,更快更准确做出决策,提高经济主体的运行效率。而征信业是社会信用体系建设的重要组成部分,发展征信业有助于遏制不良信用行为的发生,保障守信者利益,促进社会良好和谐的经济秩序,完善社会信用体系建设。
信用数据源的割裂是征信领域的主要问题。P2P行业的信用数据获取渠道极其有限,个人信用数据部分依靠借款用户自行提交,部分依靠平台上门征集,造成运营成本压力和管理压力。事业单位、相关政府部门的数据之间的交叉融合非常少,较为分散。大数据的兴起,利用我国互联网、移动互联网用户规模大的优势,有效填补了信用数据问题。其中,APP数据尤为重要。智能手机的普及,使得APP数据来源具备普遍性,覆盖人群广。手机上网比例,大众花在浏览APP的时间日平均3小时。而APP的成为大众消费、贷款、办公等个人或办公信息交流的平台。获得APP数据的合法需求和可允许要求低,APP数据的获取渠道多,自由获取,数据的规模可控,时效性非常强,真实可信,可用性高,价值高。手机APP数据纳入征信体系,能减轻数据获取成本,促进大数据风险控制的发展和信用信息共享,打破“数据孤岛”的僵局,为其提供一个契机,更有望促进我国征信体系发展,为建设我国信用社会提供有力支持。
数据说明
APP得分数据集由包含一个用户的手机设备号,基础信息和一系列APP的安装情况的原始数据集计算得到。数据集共1000条观测,每条观测表示一个用户的APP得分,共11个变量,变量具体说明如表1-1
表1-1
变量类型 |
变量名 |
详细说明 |
取值范围 |
备注 |
|
因变量 |
是否按期还款 |
定性数据 共两个水平 |
违约:0 不违约:1 |
违约率20% |
|
自变量 |
用户信息 |
性别 |
定性数据 共两个水平 |