一:选择分析领域
由于自己对数据的浓厚兴趣以及本硕数学专业的学习,我开始接触数据分析。互联网金融是一个有趣而且有挑战的领域,并且之前有学习一些金融方向的知识,因此决定着手金融行业的数据分析,在查阅了相关资料后,初步了解到互联网金融可大致划分如下图:互联网金融划分
二:分析职位需求
我认为自己要学习的技能,应该根据目标职位的要求展开。
在查阅了一些相关职位的岗位要求后,发现在专业要求上多为:数学,统计相关专业,在技术要求上:熟练运用数据分析的软件,如EXCEL,SPSS,SQL等。此外还需要有相关的业务数据分析能力,金融分析的能力也是必须的。职位相关描述如下:职位要求
三:用EXCEL进行数据分析解读数据
所采用的是拍拍贷数据,包含了成交时间从2015年1月1日到2017年1月30日的328553支信用标。数据集包含LC.csv(标的特征表数据)和LP.csv(标的还款计划和还款记录表)数据。
认真解读数据各个字段缩代表的含义,并对字段进行归类。进一步分析从这些字段可以得出哪些业务指标,进一步提出可以利用指标解决的业务问题。
2. 提出问题
我提出拟解决问题如下:
(1)使用拍拍贷的用户都具有哪些特征?
(2)整体的逾期状况如何?造成逾期的原因有哪些?
具体采用多维度分析方法,从 用户特征维度 和 逾期相关性维度 分析,对于用户特征维度,继续拆解为 用户基本特征,用户信用特征,用户行为特征三个子维度,针对于三个子维度,再分别继续划分分析维度。对于逾期相关性维度,通过假设检验法,预设了几个子维度,分别对其分析。分析思路如下图:分析思路
3. 分析问题
根据所提出的问题和分析思路,逐一做出分析,给出结论,对初步没有得出结论的问题,利用假设检验法进行拆解,验证。
首先:对拿到的数据进行数据清洗。在LC表中,Listing Id为列表的唯一键,因此作为删除重复值的参考列。操作后未发现重复值。再根据定位条件查找,发现无缺失值。观察发现LP表中“还款日期”一列存在异常值,进行筛选删除,一系列清理操作完成后,数据干净。
在分析过程中主要工具是利用数据透视图来呈现最终效果,但是在具体分析时,可能需要有额外的操作,如:
(1)为了便于分析,需要通过函数的设置来增加字段。
(2)VLOOKUP函数会经常用来查找填充所需数据。
在透视图的使用时,我们通常会用到的是条形图,柱状图,饼状图等,呈现时尽可能的让图表简洁,颜色不宜使用过多,边框底纹等元素可以删除,否则会喧宾夺主。以下为部分分析展示以及全文链接:总括结论perfect:互联网金融—拍拍贷数据分析zhuanlan.zhihu.com
四:总结
数据分析所需要的技能中,熟练运用分析工具 是最本的技能,就像建筑时使用的各种工具。具备分析思维,分析要有逻辑性,条理性,这些可能会决定你整个分析的方向以及分析的准确性,得到的结论的可信度等。因此,要多在实战中培养这两项技能,不断地完善,进步。