数据分析的流程总结

数据分析思路及流程

数据分析可以分为数据获取与存储、数据探索(EDA)、数据预处理、数据建模与分析、数据可视化展现(汇报结论)这五个主要的流程。

在这里插入图片描述
在这里插入图片描述该过程需要占用大量的精力和时间(约60%)进行数据准备,包括数据抽取、数据清洗、数据探索、数据转换。

但对于一个数据分析项目来说,里面的有些流程也并不一定是必须的,侧重点也并不一定相同,主要还是要看需求,如果需求偏向业务的话,可能主要流程就是接到业务需求→数据获取→一般从维度与指标方面或者统计学角度出发进行数据分析,得到一些结论→结论汇报给业务方,这种的重点主要还是指标体系的分析,获取数据的各项指标,从数据层面对业务有一定的分析与了解,比如电商想要了解用户的购物行为,就可以通过用户日常浏览的点击、购买、加购、喜欢收藏的行为,从整体上了解网站访问流量趋势的变化,哪些商品很受用户欢迎,网站的商品购买率。单个用户的购物需求后续进行商品推荐等,通过这些数据可以指导后续的一些活动,例如在销售量下降的时候进行促销,还可以用来作为活动效果的评判依据,通过活动前后的指标对比可以较明显得说明活动是否有效果。还可以依据业务指标制定一组数据指标,作为量化的业务指标等。通过数据来说话更有说服力。

需求偏向数据挖掘,重点可能就是数据探索与数据建模方面挖掘出主要特征,然后建立回归或者分类模型,对未来趋势进行预测,从而进行业务优化和防患于未然。当然对业务知识也要熟悉。例如软件新用户留存率分析,通过APP的日志表,把新用户在APP中的各种行为统计出来。根据用户是否有各种行为,及用户是否留存下来,建立决策树模型,找到影响用户是否留存下来的关键因素。从而对软件进行优化以提高用户的留存率。

需求也是复杂多变的,这也只是我的一个较为宏观的理解,具体分析还是要与公司和行业的具体需求挂钩。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值