数据分析内容总结(未完待续)

数据分析是指通过对大量数据的收集、清洗、处理和解释,从中提取有用的信息和洞察,并作出相应的决策或预测的过程。数据分析在各个领域都有广泛的应用,包括企业管理、市场营销、金融、医疗、科学研究等。

结合理论与实践,总结一下本人从业以来在实践过程中的数据分析相关使用场景,主要分为以下几个方面:

1、基础数据查询(对象画像描述)。
为了增加对某一问题的认知,需要进行数据查询,一般用到的工具为sql,做法就是统计学相关简单知识,如:求和、求差、周度、月度、年度等。主要适用于专题相关分析,具体如下:
1)漏斗分析。漏斗分析通常应用于一个具有多个过程组成的事件活动,比如电商场景,如果销售指标不好就需要做一个漏斗分析,从后台顾客意图猜测–>选品推荐–>加购物车–>支付–>订单完成。通过分析链路上各个环节的转化或者叫渗透率,确定问题所在,进而产出相关策略
2)留存分析。针对活动的效果需要做一个长期的监测和评判,以此来确定活动方案的迭代方向,因此就需要做用户留存分析。通过计算用户次日,7日,月度留存,对用户进行分层,老用户,新用户,有价值用户,活跃用户等几个维度,根据不同层级用户采取对应的策略。

2、报表搭建。
报表搭建一般是数据分层中的ADS层报表建立,一般根据不同的业务域进行报表开发,过程中需要设计相关指标逻辑,确定报表使用场景,以及报表更新频率,最重要的一点确认报表使用生命周期,避免数据冗余或存储资源浪费。

3、对象标签建立。
标签是数据分析过程中较为重要的依据,通过标签可以进一步构建画像,筛选客群,以及作为算法模型过程中的特征。标签加工过程中,静态标签需要顶层架构的设计,如个人信息(姓名、年龄,性别等),时间信息(年月日,时分秒),地址信息(省市县区)等维度,动态标签通常比较随意,很多具有时效性,通常也作为过程标签进行使用。标签加工完成后需要经过校验才能确保上线,在确保业务逻辑无误的情况下通常用标签覆盖率和准确率(抽样)来验证标签的可用性

4、异常指标排查。
针对某一指标出现异常,需要通过数据分析找到原因,并且给出对应的策略方案。(1)第一步需要确认数据异常是否真实,进一步检查指标的加工逻辑是否正确,以及用到的下游表的口径、更新情况;(2)确认第一步无误的情况下进行周期性规律检校,如周度、月度、年度、环比、同比,确认是否周期性因素影响;(3)在前两步都排除的情况下,需要查看外部因素影响,如电商需要查看是否竞品有相关活动,如物流需要查看是否供需比发生很大变化(天气、节假日、交通管制等影响)(4)在前三步都没问题的情况下,就需要进一步上下游相关业务挖掘,直至找到原因,给出对应策略

5、AB实验。
AB实验通常作为验证策略是否有效,在AB实验之前需要做AA实验进行实验空跑,以此来消除自然情况下两组群体的差异,AB实验周期一般以周为单位(7天、14天等),当然也可以自行定义实验周期,业务等上下游相关方达成一致即可。AB实验的方式有多种,比如群体AB,还有隔日AB,隔日半日AB(上午实验组,下午对照组,下一时间上午对照组,下午实验组)等方式。
(1)AB实验中最常遇到的问题就是实验期间内实验组与对照组的数据结构与AA期间内实验组与对照组的数据结构不一致,导致实验结果有偏。此问题的解决方法有两种:1.对实验期间内的数据按照AA期间内的数据结构进行抽样,测算数据实验结果;2.对AA期间内的数据按照实验期间内的数据结构进行抽样,测算实验效果。
(2)由于外界不可抗拒因素影响,实验会出现波动,导致无法判定策略是否有效。这时候的解决方案一般是增加实验周期,通过时间的延长给与实验组和对照组充分的表现时间;另外一个做法,虽然在区分实验组对照组时是随机分布,但是不能保证两个群体一定是随机的,在实验结果波动的情况下,可尝试反转实验群体,再进行观察来确定实验效果
(3)ABtest的效果评估是十分关键的步骤,直接牵扯到策略是否有效,应不应该放量推广。在实际的效果评估中,第一步首先要选择合适的评估指标,包含结果指标和中间过程指标,结果指标直接关系到策略效果,中间过程指标需要验证是否支持结果决策,如果结果指标表名策略有效,那还需要中间过程指标来验证是否是策略带来的提升,找到策略的效果驱动点
6、精准营销。
目的是根据营销预算,通过业务规则或者机器学习算法,筛选出对即将要营销的活动或者物品参与概率较大的客群。主要是针对不同的群体进行营销,通过规则或者评分卡或者其他机器学习算法,计算每个群体对活动感兴趣的概率,根据营销预算或者营销数量进行阈值筛选群体,进而完成营销,多适用金融业务等场景。注意需要定期更新营销人群

7、智能推荐。
与精准营销类似,但不同的是智能推荐是为每个人匹配最为可能的产品或者活动。根据用户的历史轨迹和实时行为,猜测个体在当下的意图,进行群体跟活动之间的匹配程度计算,进而跟个体推荐最为匹配的物品或活动,智能推荐在一定程度上比较依赖用户实时行为,多适用电商、物流等互联网场景。
8、业务指标可视化。
为了减少每日频繁取数,同时需要多组数据来观察数据的趋势或者规律,数据看板可视化就显得尤为重要,特别是在公司驾驶舱数据中,看板可以让数据展示的更为具体全面,为公司高层决策提供辅助。目前使用的看板有tebleau,fineBI等

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值