数据分析师面试一

前言

数据分析师面试一般有两个部分,一个是专业的知识,包括数据分析方法、数据挖掘理论、算法研究等;另一方面则是数据思维,主要考察数据分析人员在思考问题时的方式和习惯等。
本系列会分步去梳理数据分析师面试过程中的一些知识点,算法类的会根据模型的定义和优缺点进行简略的介绍;数据思维类的会着重介绍几个常见问题的类型进行介绍。

开篇

开篇介绍几个个人在工作学习中比较喜欢的几句话,也是做事的思维。

  1. 你无法衡量的东西,你也无法管理。
    这句话来自精益数据分析这本书,感觉这句话在日常工作中受益很大,尤其是当了管理者之后,在去弄清一件事之前要想办法用数据思维去衡量,有了这样的习惯之后,对自己以后做任何事都会变得更加顺手。
  2. 摩尔定律–集成电路的集成度会在两年翻一番,后来这个时期缩短到18个月。第一次看到这个概念是在浪潮之巅这本书
    个人感觉这个定律在学习上也很实用,三四年前,一个数据分析师基本上会逻辑回归、决策树基本上就很不错了,现在呢,JD上大部分都要求会常用的机器学习算法,还要深度学习、强化学习和知识图谱等等,(当然我这里所说的数据分析是广义的,包括数据分析、数据挖掘和算法)。所以,我们要想在数据分析的道路上不被“内卷”,就必须保证自己的知识容量能在18-24个月左右翻一番。

    傻逼指数:你多快觉得过去的自己是傻逼,即认知升级速度。
    既然未来的自己觉得今天的我是个SB,那今天就需要保持极度敬畏之心了。

  3. 奥卡姆剃刀定律-“如无必要,勿增实体”,即“简单有效原理”。
    剃刀原则并不是一种定理(数学之美这本书),而是一种思维方式,可用于指导我们的工作,比如我们可以用A和B达到同样的效果,但B更简单,于是我们选择B。
  4. 发现相关性可以预测未来,发现因果关系可以改变未来
    大数据时代精益数据分析这两本书中都提到过这两个概念大数据时代里面的观点是重视相关关系,放弃因果关系;而精益数据分析里面说发现相关性可以预测未来,发现因果关系可以改变未来。其实意思都差不多,在数据快速产生的时代,查找相关关系更高效也更有实际意义,但是不能否认的是因果关系比相关关系更能体现事情的本质。所以在有资源和时间的前提下,可以研究因果关系。

问题解答

先介绍数据思维相关的几个问题

一、什么样的指标才是好的数据指标
  • 好的指标能带来你所期望的变化
    • 好的数据指标时可以比较的

      不同的时间段,用户群体、竞争产品之间,可以更好的洞察产品的实际走向

    • 好的数据指标时简单易懂的
    • 好的数据指标时一个比率
      1. 比率的可操作性强,是行动导向
      2. 比率是天生可比较性指标
      3. 比率还适用于比较各种因素间的相生和相克
    • 好的数据指标会改变行为

      评判标准:随着指标的变化,你是否会采取相应的措施?
      同时要注意数据耦合性

要找到正确的数据指标,需要注意五点:

  1. 定性指标与量化指标
    定性指标通常是结构化的,经验型的,揭示性的,难以归类的;量化指标涉及很多数值和统计数据,可提供可靠的量化结果,但缺乏直观的观察。

定量数据排斥主观因素,定性数据吸纳主观因素

  1. 虚荣指标与可付诸行动的指标
    依据这个指标我将如何改变当前的商业行为
    如果不能根据数据采取行动,那么该数据就是一个虚荣指标
  2. 探索性指标与报告行指标
    知道我们知道的
知道
我们知道的
我们不知道的
不知道
我们知道的
我们不知道的
  • 检验我们的事实和假设,(比如打开率或转化率),以确保我们不是在自欺欺人,我们的商业计划是可行的
  • 验证我们的直觉,把假设变成证据
  • 为业务预测表、瀑布式开发流程图和懂事会议提供数据
  • 帮助我们发现黄金机遇,大展宏图
  1. 先见性指标与后见性指标
    先见性指标先见性指示剂 可用于预测未来,如透过销售漏斗潜在客户预测未来获得的新客户数
    后见性指标能提示问题的存在,如流失客户,亡羊补牢–不再丢新的🐑
  2. 相关性指标与因果性指标
    发现相关性可以预测未来
    发现因果关系可以改变未来
二、怎么搭建指标体系
  1. 指标体系作用:
  • 建立业务量化的标准

  • 减少重复工作,提高分析效率

    减少临时性数据分析需求

  • 帮助快速定位问题

    指标体系包括过程和结果指标,有了指标的前后关联关系,可以通过回溯和下钻,快速找到关键指标波动的原因

  1. 指标体系搭建原则
  • 指标体系要有重点:不能简单罗列,需要区分优先级
  • 指标体系要有目标:快速定位问题
  • 指标体系不是越全越好,而是和业务越贴近越好
  1. 如何搭建
  • 掌握基本的思维模型

    • 5W2H模型:what/why/when/who/where/how much/how to do
    • 逻辑树方法及MECE原则:逻辑树可以将复杂业务分解成简单问题,拆得更细的指标;MECE【相互独立,完全穷尽】,搭建指标重要的标准就是不重复不遗漏,可以把握核心指标,提升指标系统的有效性。
    • 商业画布:是一种分析企业价值的工具,通过把行业模式中的元素标准话,引导我们的思维将业务知识素材归档。
  • 指标体系搭建的方法

    • 机遇生命周期的指标体系:AARRR

      acquistion:获客–客户从哪里来
      activation:激活–用户在网站上做了什么,如何帮助其快速上手体验
      retention:留存–用户回访
      revenue:营收–你如何获得收益
      referral:推荐–用户会推荐你的产品给别人吗

    • 客户满意度指标体系:RATER指数模型

      在这里插入图片描述

三、用户画像怎么构建
基本定义

用户画像是建立在一系列属性数据的基础上的目标用户模型,一般是产品设计、运营人员从用户群体中抽象出来的典型用户,本质是一个用以描述用户需求的工具

随着互联网的发展,用户画像又有了新的内涵,根据人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型

核心工作是利用存储在服务器上的海量日志和数据库里的大量数据进行分析和挖掘,给用户贴标签,而标签是能表示用户某一维度特征的标示,主要用于业务的运营和数据分析。

作用
  1. 精准营销:在从粗放式到精细化运营过程中,将用户群体切割成更细的粒度,用短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略

  2. 用户分析:用户画像也是为了了解用户的必要补充。产品早期,产品经理通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候可以用用户画像配合研究。方向包括新增的用户有什么特征,核心用户的属性是否变化等等。

    在这里插入图片描述

  3. 数据应用:用户画像是很多数据产品的基础,诸如推荐系统广告系统,广告系统基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等来进行投放。

  4. 数据分析:用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通,最后辅助业务决策。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5dW814Z4-1600671658371)(evernotecid://A6C3AC2D-4E83-4CBF-853C-834CF455542B/appyinxiangcom/28357599/ENResource/p299)]

步骤
  1. 数据采集
  • 静态数据:人口属性、商业属性、消费特征、生活型态、CRM纬度【客户状态、生命价值、会员状态】
  • 动态数据:用户不断变化的行为信息
  1. 目标分析:用户画像的目标是通过分析用户的行为,最终为用户打上标签,以及标签的权重。
  2. 数据建模:事件模型包括:时间、地点、人物三个要素。–什么用户在什么时间,在什么地点,做了什么
    • 用户:关键在用户的标识,为了区分用户
    • 时间:时间戳和时间长度
    • 地点:用户接触点:网址和内容。
  3. 内容:每个网址中的内容,如单品的相关信息【网址决定权中,内容决定标签】
  4. 事件:用户行为【浏览、购物车、评论、购买等】

用户标签权重随时间的增加而衰减
标签权重 = 衰减因子 ∗ 行为权重 ∗ 网址子权重 标签权重=衰减因子*行为权重*网址子权重 标签权重=衰减因子行为权重网址子权重

注意事项

1、不要把典型用户当成用户画像【典型用户是虚构的抽象的】
2、不要把用户画像简单的理解成用户由标签构成【要与业务相关,如:海底捞用户画像:标签:高富帅就不合适】
3、要建立真正有效的用户画像标签:结合业务建立规则:如-杀熟

四、数据思维以及产品思维的认识
产品思维
  • 定义
    产品思维是一种解决问题的综合思维,是进一步把问题解决方案产品化的过程。

    1. 发现问题:指问题是什么
      用得最多是“用户思维和数据思维”。
      用户思维:是我们最重要的一种思维方式,因为一切产品的起点都是用户获益。你需要把自己看成消费者,在遇到同样的情况时你会做什么样的选择、有什么样的感受。
      数据思维:通过数据分析发现问题,是发现问题的重要方式。数据的涨跌和趋势表现,都是业务情况的精确反映。

    2. 分析问题:指为什么会产生这个问题
      用得最多是“本质思维”。
      本质思维:本质思维是一种寻根究底、找出问题根本原因的思维。可借助“5问法”、根源分析法等方法去开展。

    3. 解决问题:指如何解决这个问题
      用得最多是“效率思维”。
      效率思维:商业的发展方向,一定是向着更高效率的方向发展。通过提升业务参与某个或多个主体的效率,能大幅提升交易。

    4. 产品化:是问题解决方案标准化的过程
      标准化:通过归纳提炼,总结共性,最终落地为产品、产品功能、服务或SOP(Standard Operating Procedure标准作业程序)的方式,进行自动化、规模化解决同一类问题。
      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XCMA4MHk-1600671779134)(evernotecid://A6C3AC2D-4E83-4CBF-853C-834CF455542B/appyinxiangcom/28357599/ENResource/p301)]

  • 本质
    产品是什么:本质就是为了解决某类用户某种特定痛点。
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WRapTCJW-1600671779135)(evernotecid://A6C3AC2D-4E83-4CBF-853C-834CF455542B/appyinxiangcom/28357599/ENResource/p300)]

所谓的互联网产品是一种可以给用户带来微笑和金钱的黑盒子,由此可见,产品的核心是为了满足用户需求,当然是要以用户为中心

  • 同理心
    为了更好的理解用户需求,切忌空想,产品要具备同理心,要变成真正的用户
    产品调研过程中,要切身站在需求方、用户的立场思考问题,去感受需求背后的原因,这样才有助于产品方案设计,避免产品并不能真正解决用户的问题。

《像蘑菇一样思考》

一个病人他每天什么都不做,打着一把伞躲在角落里,所有医生都觉得这个人没救了。
一天,有一位心理专家站在他身边,什么都不说,拿着一把伞跟着他一样蹲在那里。
坚持一个星期后,病人终于向专家身边凑了凑,说了一句话,难道你也是蘑菇?这个故事告诉了我们什么呢?

作为产品经理,我们要扎根蘑菇群,了解蘑菇的生存法则。就像心理医生潜入病人生活一样,久而久之,耳濡目染之后,可以用用户的方式来思考,才能迅速理解问题所在。

  • 用户
  1. 定义用户
    策划一款产品,我们首先要做得就是定义用户。
    我们的目标用户是谁?我们的产品服务于谁?目标用户是怎样的一群人?他们的喜好是什么?在什么样的场景下会使用产品?

  2. 接近用户
    真正懂用户、理解用户,光靠凭空想象是不行的,得真刀真枪去接近用户。
    常见的接近用户的方法有:用户访谈、回复发帖、阅读反馈、问卷调研、走进场景、观察用户行为、分析用户数据等等。

  3. 理解用户
    接近用户是为了更好地理解用户,当你面对海量用户时,你要变换不同身份、角度、环境、场景,理解各种用户群的使用场景和需求。

  4. 变成用户
    把思维改变成用户模式,或者自己本身就是产品的忠实用户,这是做任何产品的最佳状态,这需要洞察人性,以己推人。
    真正好的产品经理,能够让自己变成一个产品外行。

    怎样才能变成产品外行呢?
    你要放下脑袋里装下的所有事儿,想象自己是一个很初级的用户,什么都不懂的用户来使用产品,这是非常难的一个功底。因为产品经理们总是太专家了,会把事情想的很复杂,把功能做得很高级,但是这些功能可能并非用户真实所需。

  • 迭代思维
    产品迭代是一个长期过程,产品设计并非一蹴而就,而是要不断试错,验证想法。
    迭代并不是先草草地做个MVP[最小可行产品]上线再说,有什么问题通过迭代解决。而是MVP发布后想尽一切办法收集用户的反馈,欢迎用户的吐槽,验证产品对用户需求满足的情况。
    如发现满足不够到位的地方,以最快的速度进行迭代,然后再验证再迭代。
    每经历一次迭代都要想办法去掉损害用户体验的功能,加强用户体验好的功能。当用户需求发生变化后,迅速反应,加紧迭代。迭代是一种成长型思维而非固定思维。
数据思维
  • 定义
    就是所有做出的判断和结论都基于数据,对数据敏感,而且善于应用数据。其实也比较简单,就是对任何事情、任何看法要有数据作为依据,即用数据说话,而不凭借自己的主观判断。
    例如:通过百度搜索指数、艾瑞数据、TalkingData、阿里数据、微信搜索指数等,这些网站都有针对一 些领域、关键字的数据分析和统计,多查一查、看一看,对于了解感兴趣的事物都是很有帮助的。
    对自己所见到的事物,能通过数据化的公式或者数值来表示的一种思维,就是我们当前最需要的数据思维。比如点击率=点击次数/页面曝光次数,这就是数据化的公式。

  • 确定目标
    要确定核心指标,就必须了解业务开展的目的。
    确定业务指标有一个基本的模型:osm模型,分别对应三个单词。

    Obejective(业务目标):用户使用产品的目标是什么?产品满足了用户的什么需求?
    Strategy(业务策略):为了达成上述目标我采取的策略是什么?
    Measurement(业务度量):这些策略随之带来的数据指标变化有哪些?
    这种确定指标的方法第一步就是要确定业务目标,如果你没有清晰的业务目标,那么也就不可能制定出准确的数据指标。

  • 数据的应用也需要具备目标。
    一般来说分为两类目标:一是解决问题,二是发现问题并解决问题。

    • 第一类的解决问题无非是遇到了明显的问题或者困境的时候,通过不断搜集数据来寻找问题根本原因,从而对症下药,解决问题。比如,日活上来了,但是转化率却一直没有变化,这就是问题。

    • 第二类的发现问题并解决问题,就是需要对当前的情况有一个解剖性的了解和探究,从而找到进化的道路,成为一个新物种,占领市场蓝海。比如,拼多多通过对当前电商的数据结构发现有绝大部分的五线城市、农村等地方都没有被电商所覆盖,因此拼多多着力覆盖这部分的人群,从而发展成为了如今堪比淘宝的庞大体量。

五、对管理的认识和理解
向下管理:
  • 目标:SMART原则

    1. S:specific:明确性–用具体的语言清楚的说明要达成的行为标准
    2. M:measurable:可衡量性–目标应该是明确的,而且目标应该有是否达成的衡量依据
    3. A:acceptable:可接受性–订立目标要能与组织的能力相匹配,并且不能与兄弟部门冲突
    4. R:realistic:可行性–在现有的资源下是否可行、可操作。
    5. T:timed:时限性–目标的完成要有时间限制
  • 激励:个人或者团队,受自身不同的需要或者感知的驱使而追去特定目标的意愿。

    1. 内在激励:个人由于曾有过与某种行为本身有关的愉快经历而愿意实施该项行为,精神激励
    2. 外在激励:并非为了行为本身的利益,而是为了与之相关的结果而产生的行为,这些结果可以包括工资、福利等
  • 控制:

    1. 前馈控制:试图预测问题并且在问题发生之前采取矫正行动
    2. 同步控制:在行为发生时使用的控制
    3. 反馈控制:衡量已经完成的行为,并且在必要时采取行动
  • 控制步骤:

    1. 建立绩效标准
      • 有形标准:数字、时间
      • 无形标准:态度、士气
    2. 衡量绩效
      • 衡量频率
      • 衡量方式
    3. 分析绩效
    4. 矫正
  • 管理复盘

    1. 回顾目标
    2. 评估结果:亮点、不足
    3. 分析原因:成功因素、失败原因
    4. 总结经验:新发现、下一步计划
同级管理

跨部门沟通

  • 五大困境

    • 认清双赢心困境,建立双赢思维
    • 认清投资心困境,建立投资情感思维
    • 认清同理心困境,建立同理思维
    • 认清责任心困境,建立责任思维
    • 认清大局心困境,建立全局思维
  • 协作
    建设性沟通=结觉问题+积极的人际关系

    1. 实现信息的准确传递
    2. 巩固和加强双方关系
    3. 解决了现实问题

    核心:换位思考
    原则:先理解被人,在表达自己

    协作方式:

    • 服务性协作:谁贴近客户谁就是指挥棒
    • 指导性协作:提供贴身支持,专业创造家中
    • 管控性协作:找到双赢支点,平等互动沟通
    • 情感性协作:关注公司整体,投资情感账户
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Andy_shenzl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值