真知1、
===========================================
第一、漏斗分析逻辑及步骤
一、比如一个电商APP(从首页到支付完成流程)
1.1、进入首页
1.2、点击广告页
1.3、点击商品详情页
1.4、点击加入购物车
1.5、进入支付页面
1.6、完成支付
总结:1、确定研究对象,2、确定事件的开始时间和结束时间,
3、拆解用户路径,4、指定关键指标(比如,最后的完成支付率)
二、漏斗分析要求的每一步数据都有埋点采集。
三、统计每一步的转化率,分析一下是否正常,(和以前的内部数据与行业数据对比分析一下)
四、漏斗分析的不足,如果真是商品、价格不行,可能得反复测试很多轮,才能看出来。所以漏斗分析本身缺点也蛮明显的。
------------------------------------------------------------------------------------------------------------------------------
二、5W2H分析方法(多维度分析方法)
1、时间:when
2、地点:where
3、人物:who
4、什么事:what
5、为什么发生:why
6、怎么做:how
7、多少钱:how much
----------------------------------------------------------------------------------------------------------------------
(1)WHEN——何时?什么时间做?什么时机最适宜?
(2)WHERE——何处?在哪里做?
(3)WHO——谁?由谁来做?
(4)WHAT——是什么?目的是什么?做什么工作?
(5)WHY——为什么要做?可不可以不做?有没有替代方案?
(6)HOW ——怎么做?如何提高效率?如何实施?方法是什么?
(7)HOW MUCH——多少?做到什么程度?数量如何?质量水平如何?费用产出如何?
------------------------------------------------------------------------------
5W2H分析法_百度百科5W2H分析法又叫七问分析法,是二战中美国陆军兵器修理部首创。简单、方便,易于理解、使用,富有启发意义,广泛用于企业管理和技术活动,对于决策和执行性的活动措施也非常有帮助,也有助于弥补考虑问题的疏漏。
https://baike.baidu.com/item/5W2H%E5%88%86%E6%9E%90%E6%B3%95/8111597
--------------------------------------------------------------------------------
三、A/B测试(也是对比分析方法)
3.1、解释什么是A/B测试:
一句话说明,A/B Test 就是控制单一变量的对照
试验。一个对照组,一个试验组,用来检测实验可
靠性。
3.2、那么什么是AB测试题:
A/B测试就是控制单一变量的对照试验。一个对照组,一个试验组,用来检测实验可靠性。
3.2.1、AB测试是为Wed 或 App 界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一 时间维度,
分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,
收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。
3.2.2、时间属性(也叫时间维度)+产品自身属性(包含人或物)+同时控制时;测试的效果才客观。
3.3、测试流程
3.3.1、确认业务,定义问题
3.3.1、通过数据或观察提出对应假设
3.3.1、找到自己认为可靠性高及ROI高的假设
3.3.1、基于这个假设提出产品设计方案
3.3.1、落地研发,进行灰度发布实验
3.3.1、获得试验数据结果,最终确定试验效果
3.3.1、效果好的话,就使用该方案
3.3.1、效果不好的话,继续挖掘问题
3.4、参考答案(流程参考答案)
实验的流程:确定目标和假设->确定指标->确定实验单位->计算样本量->实施测试->分析实验结果
3.5、自己总结(流程)
3.5.1、确认业务->
3.5.2、确定假设和指标->
3.5.3、基于这个假设提出产品设计方案->
3.5.4、确定试验单位->
3.5.5、确定样本量->
3.5.6、实施测试->
3.5.7、分析实验结果(如果效果好,就使用该方案;如果效果不好,继续挖掘问题)
3.1、https://blog.csdn.net/weixin_45666566/article/details/115180921
3.2、https://blog.csdn.net/qq_42658739/article/details/121904646
3.3、https://zhuanlan.zhihu.com/p/534117515
3.4、https://zhuanlan.zhihu.com/p/534860518
3.5、https://zhuanlan.zhihu.com/p/533917992
3.6、https://zhuanlan.zhihu.com/p/534992582
3.7、https://zhuanlan.zhihu.com/p/102287944
3.8、https://zhuanlan.zhihu.com/p/533772730
------------------------------------------------------------------------------------------------------------
四、用户分群分析
解释:用户分群是数据分析中较为常用的手段,通过不同特征的用户群体采用不同的运营方式可以为企业带来最大化的投入产出比。
五、同期群分析
5.1、同期群分析(Cohort Analysis),是按用户初始行为的发生时间,将用户划分为群组,从而分析相似群体随着时间的变化。
5.2、首先所谓的同期群,就是一种拆分客群的方法,就是把同个时间段内发生某个初始行为的客户群归为一个同期群。而这个概念的重点在于两个关键词上,“同个时间段”和“初始体验”。
6.1、为什么某段时间的留存率下降严重,因为有现金抽奖活动,大多数新用户是冲着「现金红包」来的,对 APP 本身并不感兴趣,当天抽奖活动结束后就不再关注了。
6.2、首先说下为什么要进行同期群分析?
产品周期:产品从初期到后期的成熟稳定,产品形态和商业模式都是在不断迭代的,前后用户体验的差异是巨大的;
用户质量:产品发布初期的种子用户和后续买量带来的用户,在用户质量上的差异也是很大的。
所以,我们要将用户按照同期性构成一个群组,比较不同的同期群在生命周期内的变化,以此分析产品的变化。
https://baijiahao.baidu.com/s?id=1724353089227160804&wfr=spider&for=pc
https://blog.csdn.net/m0_69435474/article/details/124751778
https://zhuanlan.zhihu.com/p/36779577
https://zhuanlan.zhihu.com/p/358835156
https://zhuanlan.zhihu.com/p/73677937
https://www.sohu.com/a/291839248_500660
六、分布分析:
比如电商APP的下单行为,一天24h的下单量分布,来分析一天内哪个时间内是下单高峰期。
七、数据埋点逻辑:
其他、----------------------------------------------------------------------------------------------------------------------
数据分析(埋点数据分析)
1、
https://mp.weixin.qq.com/s?__biz=MzIwMTQ2NzY4OA==&mid=2247484001&idx=1&sn=ef381f5da03bdf44a76439bacf404971&chksm=96ec3026a19bb9307e9cc21aa262ec2acac14613a2bb6562941e2de4208a766fecdc921d7e96&scene=21#wechat_redirect
2、
https://mp.weixin.qq.com/s?__biz=MzIwMTQ2NzY4OA==&mid=2247484014&idx=1&sn=613e6681dbecedc5b810547f485a4b02&chksm=96ec3029a19bb93f5536a93c62e6b1e269d7b2d2ef64d6ced0d4903a6307da47fd2ce527fa0c&scene=21#wechat_redirect
3、
https://zhuanlan.zhihu.com/p/375756992
----------------------------------------------------------------------------------------------------------------------
名称解释:
转化率,
举例:漏斗分析经常用,第一级100人下载,第二级50人注册。那注册转化率就是50/100 = 50%的转化率
留存率(次日留存、3日留存、7日留存),
举例:留存率计算公式主要有:
1、以账号为基础计算:
留存率=活跃账号留存/新增账号留存(第一次新增账户)*100%。
2、以设备为基础计算:
留存率=活跃设备留存/新增设备留存(第一次新增账户)*100%。
活跃度,
举例:
日用户活跃度 = 日“溜达”用户数/总产品用户
https://www.qinzhiqiang.com/archives/147953.html
https://www.yymiao.cn/other/84046.html
跳出率,
举例:
跳出率计算公式:
跳出率是指在只访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量的百分比。跳出率计算公式:跳出率=访问一个页面后离开网站的次数/总访问次数
-----------------------------------------------------------------------------------------------------------------
其中,DAU和UV区别是:
1、DAU是日活跃用户数量;UV是网站独立访客。
2、DAU有时间限制,是计算在一日之内,不重复的访问用户数量;UV没有时间限制,使用UV作为统计量,可以更加准确的了解单位时间内实际上有多少个访问者来到了相应的页面。
3、DAU主要是计算登录或使用了某个产品的用户数;UV是计算在单位时间内实际上有多少访问者访问网站
4、dau、mau、pcu、dnu、wau、acu、uv的意思是什么?怎么分析?
4.1、 SPU 与 SKU 的关系寄区别:
5、
ARPU是单用户价值法,用来衡量电信运营商和互联网公司业务收入的指标。
ARPU注重的是一个时间段内运营商从每个用户所得到的收入。ARPU值高,未必说明利润率就高,因为利润需要考虑其成本。
现在ARPU也应用于电信之外的产品,例如游戏行业。通过ARPU,游戏运行者们可以找到一个最佳方案去确定产品的价格。ARPU的计算方法有很多种,不同的方法会影响数值的大小。一般说的ARPU值为每月用户贡献的收入,计算公式为:ARPU值=总收入/总用户数。在游戏行业,衍生出了很多计算方法,第一种是ARPU值=月总收入/月总平均在线用户数,第二种ARPU值=月总收入/月付费用户数,第三种ARPU值=月总收入/月付费活跃用户数,第四种ARPU值=月总收入/月用户总数,这几条公式的差别主要在于分母的用户数,并不存在一个统一的标准。提升ARPU质最有效的方法是让利活动。
PUR:付费用户占比
ARPUR:ARPUR=总收入/付费用户数
---------------------------------------------------------------------------------------------------
如何通俗理解ROA、ROE、ROI这三个指标,有什么区别?
ROA (总资产收益率) = 利润额/资产总额,
ROE(净资产收益率)= 利润额/股东权益,
ROI (投资回报率)= 项目利润/项目投资总额
如何通俗理解ROA、ROE、ROI这三个指标,有什么区别?_百度知道
AARRR,用户的生命周期;
AARRR(主要用于toC,toB可参考)对应用户生命周期中的5个重要环节:获取、激活、留存、收益(转化收益)、推荐(转发推荐)。
因为每个环节都只有一部分用户会进入下一环节,整体生命周期呈现出漏斗形状,所以叫漏斗模型。AARRR模型的核心就是以用户为中心,以完整的用户生命周期为指导思想,分析用户在各个环节的行为和数据,以此来发现用户需求以及产品需要改进的地方。
1. 获取(Acquisition)
获取环节首先要做的就是触达用户,获取阶段的核心任务就是找到投入产出比最好的几个渠道。触达用户后,吸引用户进入产品是获取环节的关键。
2. 激活(Activiation)
激活是第二个环节,我们需要把获取的用户转化为产品的真实用户。简单来说,就是用户下载了你的App后,至少要打开App体验一下核心的业务。并不是每个获取来的用户都是产品的目标用户,所以肯定会有一部分用户在这个阶段流失。通常情况下,用户只有看到特别吸引自己的卖点才会激活,否则他们可能只是看了一下产品的界面,随便操作几下就流失掉了。
3. 留存(Retention)
留存是第三个环节,我们需要把激活的用户转换为产品的长期用户,避免出现“用户来得快,走得也快”的现象。通常情况下,产品只有真正满足了用户的某些需求或者帮助用户解决了某些问题,他们才会持续不断地使用,对产品产生粘性,成为真正意义上的留存用户。
4. 收益(Revenue)
收益是第四个环节,我们需要将留存的用户转换为收益,这样企业才能获取收入,毕竟绝大部分商业产品的最终目标是获得利润。收益环节是对企业来说非常关键,因为它决定了企业能否在激烈的市场竞争环境下存活下来;而且用户产生付费行为的意愿高低,往往也是衡量产品是否满足用户需求的一个关键指标。
5. 推荐(Refer)
推荐是最后一个环节,我们需要通过“以老带新”的方式来实现用户增长。老用户的推荐说服效果强,成本又低,再加上目前社交网络几乎覆盖了绝大部分互联网用户,所以老用户的推荐能够带来很多的新用户,如果能够形成“病毒式传播”,产品可能一夜爆红。用户推荐虽然有很多优点,但也不能本末倒置、只想着通过“病毒式传播”一夜爆红,良好的产品才是长期发展的核心。
————————————----------------------------------------------------------------------------————
https://blog.csdn.net/songcf_faith/article/details/124797481
https://www.jianshu.com/p/6d6dcf61131b
https://baike.baidu.com/item/AARRR/6962373?fr=aladdin
https://baijiahao.baidu.com/s?id=1668625475976306084&wfr=spider&for=pc
https://www.niaogebiji.com/article-112649-1.html
https://zhuanlan.zhihu.com/p/403223813
-------------------------------------------------------------------------------------------------------------------------
AIDMA,用户行为周期;
https://baike.baidu.com/item/AIDMA/9396942?fr=aladdin
https://zhuanlan.zhihu.com/p/443015671
https://zhuanlan.zhihu.com/p/336008111
https://wiki.mbalib.com/wiki/AIDMA
-----------------------------------------------------------------------------------------------------------------------
集成第三方SDK(软件开发工具包; 软件开发包; 软件开发套件; 软件开发工具; 软体开发套件)
使用第三方平台工具进行埋点、统计和上报,比如友盟、神策、百度移动统计、Sensors Data、GrowingIO、Talking Data等。
这种方式的成本较低,部分基础服务免费,但是数据会存在不安全的风险,而且只能进行通用的简单分析,无法定制化埋点方案。所以,一般中小型企业或产品早期,都会选择此方式,满足业务的基本数据诉求。
总结:--------------------------------
1、数据分析就是避免太主观的分析问题,要通过数据,客观全面的分析问题。
其他:------------------------------------------------------------------------------------------------------------------
1、对于业务数分来说,面试前需要在简历中体现你的分析项目案例,这点比较重要;所以需要你自己去找一个你熟悉的行业的案例,自己分析一下,最好落地为分析报告,以便跟面试官聊
2、
实际工作中,主要工具还是SQL、Excel、部分公司有时候会用到Python,BI工具会一种就可以,基本都是相通的
3、
一些互联网公司会问统计分析模型(类似于线性回归,方差(标准差)分析这些,都是统计学的知识)
3.1、解释标准差和方差的关系
方差和标准差之间有什么关系?_百度知道https://zhidao.baidu.com/question/1174390642536335699.html
百度安全验证https://baijiahao.baidu.com/s?id=1711667771183294340
4、
业务数分的流程?这个问题有点大,跟你说个如果业务出现异常该怎么分析
4.0、先梳理一下业务及问题。
4.1 确认数据统计口径
(统计口径是指统计数据所采用的标准,即进行数据的统计工作所依照的指标体系。
统计口径包括统计方式、统计范围等指标。)
4.2 再确认数据来源,核查数据是否正确
4.3 若确实业务有异常,就需要排查原因
4.4 从内部和外部着手
4.5 内部主要是从渠道、产品、运营等是否有问题
4.6 外部主要是从同行,不可抗力,国家政策等
4.7 采用相关分析方法完成上述分析
4.8 得出结论
4.9 给出落地解决方案
5、
面试讲究的是表达能力,能够逻辑清晰的回答面试官的问题
6、
让面试官觉得你很专业
7、
面试岗位工作内容的话,需要了解清楚,要确保是自己想干的,因为现在的数分岗参差不齐
8、
============================================ 重点解释数据分析
9、解释什么是数据分析:
9.1、数据分析是基于对业务的理解,利用自己的数据分析思维,形成分析思路,使用Excel,sql,python等分析工具进行取数分析和可视化,给出结论和方案,并协调各方资源推到方案落地,回到业务中去的闭环。
-------------------------------------------------
普通分析师:提数、做报表、分析指标
=================================================================
一、mysql 查询逻辑及查询顺序
mysql 查询逻辑及查询顺序_Jack_2085的博客-CSDN博客_mysql查询逻辑
====================================================================
二、数据指标 VS 标签体系,到底有啥区别?
数据指标 VS 标签体系,到底有啥区别?_Jack_2085的博客-CSDN博客
======================================================
三、财务数据分析中经常用的基本指标
3.1、财务分析30个基本指标 - 知乎
3.3、企业盈利能力五大指标之:毛利率、净利率、净资产收益率、总资产收益率、净利润现金流比率(深度好文) - 知乎
3.4、
四、相关分析(Excel怎么计算相关系数)
4.1、https://jingyan.baidu.com/article/ce09321b618b326afe858f35.html
4.2、
1、通过相关系数(correl这是excel函数),找到问题。
2、通过回归分析,可以大体预测出,数据的相关关系值。
4.3、 第一步求:相关系数,第二步求:回归分析中的值(需要勾选显示公式),
五、因果分析,相关分析与归因分析的区别
5.1、因果分析解释:一定有时间顺序,有了A才能出现B
5.2、相关分析解释:来店的人多了,销售额就高了,但是销售额,不一定就高。
5.3、回归分析解释:来店的人多了,销售额就高了,提炼出相关系数(corrle函数),形成回归方程式,预测达成目标的条件。
总结,回归分析是相关分析的延续。在特殊情况下,相关分析,回归分析,就是因果分析。但是,逆向推理不成立。
六、窗口函数,row_number(),rank(),dense_rank()的区别:
6.1、row_number(),
此方法不管排名是否有相同的,都按照顺序进行排序。例如 1,2,3,
6.2、rank(),
此排序方法进行排序时,相同的排序是一样的,而且下一个不同值是跳着排序的,
例如:1,1,3
6.3、dense_rank(),
此排序方法进行排序时,相同的排序是一样的,但是后面名次不跳跃,
例如:1,1,2
七、计算复购率(自己练习用的)
select * from users;
select * from goods;
select * from users_goods_buy;
-- 复购率的计算公式
-- 计算一周内买A商品的所有用户
select count(DISTINCT uid) from users_goods_buy t where t.gid = 1 and '2022-09-01'<=left(t.buy_date,10)<='2022-09-07'
-- 通过对用户分组,查询本周内有大于等于2次以上的购买,A商品的用户人数。
select count(tb.tuid) as tol_num from (
select ta.uid as tuid,count(ta.gid) as cnum from users_goods_buy ta
where ta.gid = 1 and '2022-09-01'<=left(ta.buy_date,10)<='2022-09-07'
group by ta.uid
HAVING cnum>1) tb
-- 本周有两次购买A商品的的用户/本周所有购买A商品的用户 = 本周商品的复购率
================================================面试中的sql语句
八、模拟分组查询(自己练习用的)
select 范围 as '单量',
count(DISTINCT customer_id) as "客户数"
from (
select customer_id,num,
CASE
WHEN num<=5 THEN "0-5"
WHEN num>=6 and num<=10 THEN "6-10"
WHEN num>=11 and num<=20 THEN "11-20"
ELSE
"20以上"END as "范围"
from(
select customer_id, count(customer_id) as num
from t_b
where created_date >= '2020-05-01' and created_date <= '2020-05-31'
GROUP BY customer_id
) as t_a
) as t_b
GROUP BY 范围;
九、求城市人口占国家的比例。
9.1、创建表和数据
CREATE TABLE `country_city_people` (
`country` varchar(255),
`city` varchar(255),
`people` int
) ;
-- ----------------------------
-- Records of country_city_people
-- ----------------------------
INSERT INTO `country_city_people` VALUES ('美国', '洛杉矶', 3);
INSERT INTO `country_city_people` VALUES ('中国', '北京', 5);
INSERT INTO `country_city_people` VALUES ('中国', '上海', 4);
INSERT INTO `country_city_people` VALUES ('中国', '深圳', 3);
INSERT INTO `country_city_people` VALUES ('德国', '柏林', 2);
INSERT INTO `country_city_people` VALUES ('美国', '硅谷', 4);
9.2、实现的步骤如下:
---- 求城市人口占国家的比例。
select * from country_city_people;
select country, sum(people)
from country_city_people
GROUP BY country
select country, sum(people)
from country_city_people
GROUP BY country,city
select * ,r.people/r.tjp
from (
select * ,sum(people) over (partition by country) as 'tjp'
from country_city_people ) r
------- 下面是简化版
select * ,people/sum(people) over (partition by country) as 'tjp'
from country_city_people
========================================== 课外附加题
----- 把country 看成科目,把city看成学生姓名,把people看成成绩,求各科成绩的第二名。
select * ,dense_rank() over (partition by country ORDER BY people) as 'km'
from country_city_people
---------- 求各科成绩的第二名
select * from (
select * ,dense_rank() over (partition by country ORDER BY people) as 'km'
from country_city_people ) r
where r.km=2
-----------------------------------------------------------------------窗口函数的学习文章
十、
十一、
十二、
十三、
=======================================================案例描述分析:
1、案例标题。任何案例都需要有标题,标题最好能够突出案例中的典型情境或反映出案例中事件的主题。
2、案例背景。所有的事件都是发生在特定的时空框架与背景之中的。
3、案例事件与过程。案例的主体就是对案例事件以及案例发生过程的描述。
4、对案例的反思。对案例事件进行分析与反思是一个完整的教学案例的必要组成部分
案例1、
案例标题及场景:消费者从预览商品到购买商品流程分析案例(用的是漏斗分析方法)
案例的事件与过程:
消费者预览商品列表页面===》》》点击商品进入商品详情页面(的转化率)
消费者预览商品详情页面===》》》点击加入购物车(的转化率)
消费者加入购物车页面===》》》支付页面(的转化率)
支付页面===》》》付款成功(转化率)
最后和产品,开发,测试一起讨论,把商品的详情页面,需要完善,重新发布一版。
对案例的反思及总结:任何功能的实现,或分析思路,都要围绕着客户的用户体验来设计,这是做好产品的第一原则。
案例2、
案例标题及场景:如何实现广告的精准投放分析案例(用的是多维度拆解分析方法)
案例的事件与过程:对消费者购买商品的信息按维度拆分:
1、时间维度(按天,周,月等统计分析)
2、区域维度来分析
3、消费人群维度来分析
对案例的反思及总结:因为现在是信息爆炸的时代,精准投放广告是很有必要的,能提高ROI的收益率,最好加上顺口的广告语,这样能刺激到消费者的心智,不容易忘掉。
============================================= 下面是网上分析的资料
如何实现精准投放广告?
1、消费人群
虽然现在的资讯越来越大众化,但是有些产品是有着明细的消费人群区分的,如性别、年龄阶段等。举个简单的例子,美妆、服装、卫生巾等这类产品是有确定的用户群体的。根据产品的具体人群进行精准投放。
2、目标地域投放
可以根据地域的情况,有针对性地投放产品。这样的广告投放不仅可以带动产品的火爆销售,还可以提高产品的收益。
3、时间不同投放时间
根据受众用户的活动时间进行分时间段投放,这样也可以提高广告曝光度,也可以减少广告投放的费用,同时也可以提高精准性,一举多得。
案例3、
案例4、
===============================================下面是数据仓库的业务流程图:
1、oltp与olap是什么
oltp与olap是什么https://baijiahao.baidu.com/s?id=1716745952349227984&wfr=spider&for=pc
2、数仓OLAP基础知识
3、数据仓库简介-ODS、DW和DM概念区分
4、数据建模与分层
5、ETL常用的三种工具介绍及对比Datastage,Informatica和Kettle
6、数据仓库学习
7、
8、
9、
10、
11、
12、
13、
================================================= 建模工具,及其他知识点
1、powerdesigner 与 PdMan
2、什么是数据血缘,如何做好数据血缘分析?
什么是数据血缘,如何做好数据血缘分析?https://baijiahao.baidu.com/s?id=1741856405289749570&wfr=spider&for=pc
=================================================== 零售行业分析
2、
3、
4、
数据分析师熬夜整理:最全「零售业」数据指标和使用技巧https://baijiahao.baidu.com/s?id=1726425510057396442&wfr=spider&for=pc
5、
6、
7、
8、
9、
10、
11、
12、
========================================== 数据分析报告书写流程
一、数据分析报告书写流程
1、明确分析目的
2、拆解指标发现问题
3、给出结论
4、结合业务,给出建议和落地方案
2.1、
2.2、
2.3、
2.4、
========================================== 关于信用卡业务
1、建立用户画像,
1.1,年龄,性别,职业,收入,婚姻,有几个孩子,单位性质,等维度分析。
1.2、对优质顾客,没有逾期,经常刷卡消费的用户,提醒账单分期业务。
1.3、对优质顾客,给装修贷,或购车贷,等账单分期业务。
1.4、再根据场景,推出一些,场景信用卡(加油卡,高铁卡,或超市购物卡)等