【干货】常用的7种数据分析方法,建议收藏

在进行数据分析时,我们通常需要用到各类数据分析模型和方法,一是为了让自己的结论更有说服力,二是让论证过程更具备逻辑性和条理性。
以下整理的是常见的数据分析方法,不同的分析方法适用于不同的场景。要注意数据分析方法并非只有做数据分析工作中会用到,生活中也颇有用处,换个角度思考问题或许就能发现新的世界。1. 逻辑树分析法如果你分析的目的是想把复杂的事情变简单,可以使用逻辑树分析法。有名的费米问题就是使用逻辑树分析法。费米问题的本质在于将未知问题逐步拆解成已知问题,通过建模和生活经验给出大致估计。

费米问题案例

在一次芝加哥大学课堂上,费米问学生。芝加哥市有多少调琴师,学生们一脸茫然。费米提示把这个问题“分解成一些便于操作的小问题,然后鼓起勇气作猜测和假设”。

芝加哥有多少居民?可靠的估算是300万;平均每个家庭有多少人?4人;多少家庭有钢琴?大概三分之一,那么全市大约就有25万架钢琴;一架钢琴隔多长时间需要调音?平均5年,那么芝加哥平均每年有5万架次的钢琴需要调音;每个调音师每天能为多少架钢琴调音?4架;假设他一年工作250天,那么他每年约为1000架钢琴调音。由此,费米和学生们推测,芝加哥市大概有50位钢琴调音师。事后有人用电话号码簿加以验证,实际统计的结果与费米的猜测十分接近。
在这里插入图片描述
在求职面试中,也经常会考察这种问题:全国有多少个产品经理?
深圳地铁高峰期客流量多大?公司楼下摆小摊月入多少?2. 漏斗分析法漏斗分析法是数据领域最常见的一种“程式化”数据分析方法,它能够科学的评估一种业务过程,从起点到终点,各个阶段的转化情况。通过可以量化的数据分析,帮助业务找到有问题的业务环节,并进行针对性的优化。
当我们分析用户从进入产品到完成消费的过程时,可以大体分为如下几个关键步骤:进入首页、查看商品页、加入购物车、进入支付页面、成功支付。通过分析每个阶段的转化率和流失率,能够直观地发现很多问题,进而找到提升KPI的方法。在这里插入图片描述
自媒体运营案例

例如,在自媒体运营方向,假设一个自媒体账号有10W粉丝,发送一篇文章获得1W阅读,大约有1K用户收藏了文章,最后由100用户进行了付费打赏。那么这个10W - 1W - 1K - 100也是典型的漏斗环节,用户付费转化率就是0.1%。

如果需要提升付费转化率,需要以这个数据作为依据,来判断到底是应该打广告来增加阅读量,还是引导用户多收藏文章。3. 留存分析法留存分析主要分析用户的整体参与程度、活跃程度的情况,考察进行某项初始行为的用户中,会进行回访行为的人数和比例。通过留存分析模型,能对事件的影响进行宏观把控,优化决策。在这里插入图片描述
以从用户活跃到消费举例来说,可以解决如下问题:

用户使用产品后的1个月内,进行消费转化的人数和占比情况?
用户使用产品后的1个月内,完成消费,且消费金额达到200元的人数和占比情况?
上海用户使用产品后的1个月内,进行消费转化的人数和占比情况?
一线城市用户使用产品后1个月内,完成消费,且消费金额达到200元的人数和占比情况?
全用户的30日LTV情况如何?
4. 矩阵分析法矩阵分析法是指根据事物的两个重要属性作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法,其中,最有名的就是波士顿矩阵(BCG Matrix,Matrix: Boston Consulting Group)。

波士顿矩阵是以市场增长率和市场占有率作为坐标轴,将企业产品分为四类,如下图所示。

在这里插入图片描述
在两坐标轴上分别按某一标准进行刻度划分,构成四个象限,将要分析的每个事物对应投射至这四个象限内,进行交叉分析,直观地将两个属性的关联性表现出来,进而分析每一个事物在这两个属性上的表现,因此它也称为象限图分析法。
矩阵关联分析法在解决问题和资源分配时,为决策者提供重要参考依据。先解决主要矛盾,再解决次要矛盾,有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,有利于决策者进行资源优化配置。5. 5W2H分析法5W2H分析法是以五个W开头和两个H开头的英语单词进行提问,从回答中发现解决问题的线索,即何因(Why)、何事(What)、何人(Who)、何时(When)、何地(Where)、如何(How)、何价(How much),这就构成了5W2H分析法的总框架。

在这里插入图片描述
该方法广泛用于企业管理和技术活动,对于决策和执行性的活动措施也非常有帮助,也有助于弥补考虑问题的疏漏。

餐饮公司客户流失案例

某家线下餐饮企业最近一个月显示客户明显减少,通过业务部门的初步分析判断是由于老用户的严重流失,但是业务部门无法追踪到用户流失的准确原因,想让你来通过现有的数据进行问题定位。这个问题是比较常见的用户流失分析,用5w2h来分析:
分析思路:what:老用户近一个月流失了很多。

where:哪家门店流失最多?什么地段流失最多?
who:什么人流失了最多?用户画像如何?是否与年纪、职业、性别有关?
when:什么时候流失最多?某个星期?某一天?一天中的某段时间?
why:为什么流失?因为菜品难吃?价格过高?有了竞争对手?环境原因?
how:怎么流失的?阶梯式流失?断崖式流失?缓慢式流失?
how much:流失了多少?是否处于正常水平?有了分析思路,我们就可以直接取出相应数据进行分析了,这里我们主要从客户类别、客户画像、客流量、成本、活动等维度入手,观察数据异常情况,找出客户流失的规律。6. 关联分析关联分析,就是从大规模数据中,发现对象之间隐含关系与规律的过程,也称为关联规则分析。

购物篮分析

购物篮分析,最早是为了发现超市销售数据库中不同的商品之间的关联关系。说起购物篮分析,最经典的案例就是:啤酒与尿不湿。讲的是在美国沃尔玛超市里,经理发现很多啤酒和尿不湿一起购买的订单,经过调查发现是男性来给孩子买尿不湿时,会顺带给自己再买几瓶啤酒。后来经理把啤酒和尿不湿摆在一起,大大提高了两者的销量。
在这里插入图片描述
用关联分析方法分析产品的关联度,即同时购买A、B产品的概率。关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或绑定销售的方式可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。7. RFM分析法通过识别出有价值的用户,对用户进行分类,然后对不同价值类别用户采取不同的运营决策,把公司有限的资源发挥最大的效果,这也就是我们常听到的精细化运营。

RFM是3个指标的缩写,通过这3个指标对用户分类:

最近一次消费时间间隔(Recency):用户最近一次消费距离现在有多长时间了,R值越小,也就是消费离得越近,用户价值越高

消费频率(Frequency):用户在一段时间内消费了多少次,F值越大,购买频率越高,用户价值越高。

消费金额(Monetary):
用户一段时间内的消费金额,M值越大,消费金额越高,用户价值越高。

在这里插入图片描述
用户分类后如何精细化运营呢?我们举例说明前4类用户:

1、重要价值用户:RFM三个值都高,要提供VIP服务。
2、重要发展用户:消费频率低,RM值都很高,所以要想办法提高这群用户的消费频率。
3、重要保持用户:最近一次消费距离现在时间较远,FM值很高,这种是一段时间没来的忠诚用户,应该主动和他们保持联系,提高复购率。
4、重要挽留用户:消费频率和最近一次消费时间间隔较远,但是消费金额高。这种用户即将流失,要主动联系用户,调查是哪里出现问题,想办法挽回。这样通过精细化运营,不断将用户转化为重要价值用户。

  • 12
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,很高兴为您解答这个问题。 在深度学习中,数据增强是一常用的技术,它可以通过对原始数据进行变换、裁剪、旋转、翻转等操作,来扩充训练集,从而提高模型的泛化能力和鲁棒性。在图像领域,常用的数据增强方法包括随机裁剪、随机旋转、随机翻转、色域变换等。下面,我将为您介绍如何使用 Python 对图像进行随机数据增强。 1. 随机裁剪 随机裁剪是一简单而有效的数据增强方法,它可以通过对原始图像进行随机裁剪,来扩充训练集。在 Python 中,我们可以使用 PIL 库中的 Image 模块来实现随机裁剪。 ```python from PIL import Image import random def random_crop(img, crop_size): w, h = img.size left = random.randint(0, w - crop_size) top = random.randint(0, h - crop_size) right = left + crop_size bottom = top + crop_size return img.crop((left, top, right, bottom)) ``` 2. 随机旋转 随机旋转是一常用的数据增强方法,它可以通过对原始图像进行随机旋转,来扩充训练集。在 Python 中,我们可以使用 PIL 库中的 Image 模块来实现随机旋转。 ```python from PIL import Image import random def random_rotate(img, angle_range): angle = random.uniform(-angle_range, angle_range) return img.rotate(angle) ``` 3. 随机翻转 随机翻转是一简单而有效的数据增强方法,它可以通过对原始图像进行随机翻转,来扩充训练集。在 Python 中,我们可以使用 PIL 库中的 Image 模块来实现随机翻转。 ```python from PIL import Image import random def random_flip(img, flip_prob): if random.random() < flip_prob: return img.transpose(Image.FLIP_LEFT_RIGHT) return img ``` 4. 色域变换 色域变换是一常用的数据增强方法,它可以通过对原始图像进行色彩变换,来扩充训练集。在 Python 中,我们可以使用 PIL 库中的 Image 模块来实现色域变换。 ```python from PIL import Image import random def random_color(img, color_range): r, g, b = img.split() r = r.point(lambda i: i + random.randint(-color_range, color_range)) g = g.point(lambda i: i + random.randint(-color_range, color_range)) b = b.point(lambda i: i + random.randint(-color_range, color_range)) return Image.merge('RGB', (r, g, b)) ``` 以上就是使用 Python 进行随机数据增强的一些常用方法,希望对您有所帮助。如果您有任何问题,请随时联系我。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值