数据分析大纲梳理

数据分析主流程: 

1、 明确业务需求
2、 明确数据需求
3、 数据准备(数据筛选,数据清洗)
4、 相关性分析(扩展如何筛选那几个月特征是相关关键性特征)
5、 分割测试集和训练集
6、 确定模型,训练并检验
7、 模型调优,交叉验证
8、 测试,最后出结果

明确业务需求

需要明确自己本次分析过程需要产生什么样的决策。比如一般核心诉求是想多挣钱。一般而言多挣钱可以有两种途径,一种是提高订单量,另一种是提高利润率,那么我们需要为哪种途径进行数据分析呢??

明确数据需求 

 对于业务需求,最终还是要反应到数据上的。对于订单数据而言,我们需要知道,我们有哪些已有数据,同时哪些数据有可能会影响到订单量,进行梳理

数据准备 

这里就是进行数据获取,筛选和对异常值的处理等等 

相关性分析 

已有数据中,不是所有数据种类都是有效的。订单相关的数据有:下单当天的天气,订单金额,下单人的年龄,下单人的性别,甚至还有订单的时长。如果我想提高订单量,那么订单使用时长对于本次分析就没有任何作用,这块内容会在后面详细展开

测试集和训练集 

一般将数据按照特定规则进行2 8分,或者3 7 分,使用训练集进行训练之后,另一部分则进行检测

确定模型 

 这里是数据分析核心中的核心了。针对不同的应用场景,会有不同类型的分析模型进行数据分析。并根据训练出的模型进行测试集的检验。这块后面会进行详细分类说明

模型参数,调优

根据检验结果进行模型或者参数的调整。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

世纪殇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值