mysql 李天生_超级菜鸟怎么学习数据分析?

本文介绍了一位数学专业背景的作者如何进入数据分析领域,特别是互联网金融行业。作者通过分析拍拍贷的数据,理解了相关职位的需求,学习了EXCEL等工具进行数据清洗和分析,探讨了用户特征、逾期状况等关键问题,并展示了分析过程和结论。强调了数据分析中的工具使用和思维逻辑的重要性。
摘要由CSDN通过智能技术生成

一:选择分析领域

由于自己对数据的浓厚兴趣以及本硕数学专业的学习,我开始接触数据分析。互联网金融是一个有趣而且有挑战的领域,并且之前有学习一些金融方向的知识,因此决定着手金融行业的数据分析,在查阅了相关资料后,初步了解到互联网金融可大致划分如下图:互联网金融划分

二:分析职位需求

我认为自己要学习的技能,应该根据目标职位的要求展开。

在查阅了一些相关职位的岗位要求后,发现在专业要求上多为:数学,统计相关专业,在技术要求上:熟练运用数据分析的软件,如EXCEL,SPSS,SQL等。此外还需要有相关的业务数据分析能力,金融分析的能力也是必须的。职位相关描述如下:职位要求

三:用EXCEL进行数据分析解读数据

所采用的是拍拍贷数据,包含了成交时间从2015年1月1日到2017年1月30日的328553支信用标。数据集包含LC.csv(标的特征表数据)和LP.csv(标的还款计划和还款记录表)数据。

认真解读数据各个字段缩代表的含义,并对字段进行归类。进一步分析从这些字段可以得出哪些业务指标,进一步提出可以利用指标解决的业务问题。

2. 提出问题

我提出拟解决问题如下:

(1)使用拍拍贷的用户都具有哪些特征?

(2)整体的逾期状况如何?造成逾期的原因有哪些?

具体采用多维度分析方法,从 用户特征维度 和 逾期相关性维度 分析,对于用户特征维度,继续拆解为 用户基本特征,用户信用特征,用户行为特征三个子维度,针对于三个子维度,再分别继续划分分析维度。对于逾期相关性维度,通过假设检验法,预设了几个子维度,分别对其分析。分析思路如下图:分析思路

3. 分析问题

根据所提出的问题和分析思路,逐一做出分析,给出结论,对初步没有得出结论的问题,利用假设检验法进行拆解,验证。

首先:对拿到的数据进行数据清洗。在LC表中,Listing Id为列表的唯一键,因此作为删除重复值的参考列。操作后未发现重复值。再根据定位条件查找,发现无缺失值。观察发现LP表中“还款日期”一列存在异常值,进行筛选删除,一系列清理操作完成后,数据干净。

在分析过程中主要工具是利用数据透视图来呈现最终效果,但是在具体分析时,可能需要有额外的操作,如:

(1)为了便于分析,需要通过函数的设置来增加字段。

(2)VLOOKUP函数会经常用来查找填充所需数据。

在透视图的使用时,我们通常会用到的是条形图,柱状图,饼状图等,呈现时尽可能的让图表简洁,颜色不宜使用过多,边框底纹等元素可以删除,否则会喧宾夺主。以下为部分分析展示以及全文链接:总括结论perfect:互联网金融—拍拍贷数据分析​zhuanlan.zhihu.comea1041a6fa0c38264e0e0814db2a1b3a.png

四:总结

数据分析所需要的技能中,熟练运用分析工具 是最本的技能,就像建筑时使用的各种工具。具备分析思维,分析要有逻辑性,条理性,这些可能会决定你整个分析的方向以及分析的准确性,得到的结论的可信度等。因此,要多在实战中培养这两项技能,不断地完善,进步。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值