数据分析常用的7大思维方法详解

今天老李给大家讲解数据分析经典的思维模型,介绍结构思维、演绎推理思维、归纳总结思维和相关思维

数据分析常用的7大思维方法详解

 

结构思维 

很多人在分析的时候没有思路,不知道从何下手,这就是缺少结构化思维的表现

不如我们就直接看一下下面这个例子,看看大家是否具有结构化思维:

一家线下零售企业最近某个产品的销售额下降了,让你找一下造成销售额下降的原因是什么。

我们看一下甲乙两个人的分析思路是什么?

甲:

先从时间维度上进行分析,看看销售额的下降是突然下降,还是持续性下降;然后再以门店为维度,看一下是不是因为地理位置的原因造成了下降;除此之外,还要对比一下横向的竞争对手,可以去问一些销售人员他们掌握的情况;对了,还有活动,有可能是因为活动造成的销售额下降。

非常混乱对不对?

这是因为我们在思考问题的时候,习惯用点对点的方式,想到一点就是一点

也就是说是乱打枪,也许有可能你可以凭借着经验找到原因

但是大多数情况下,你很难找到完全穷尽的原因,也就是为什么你的数据分析总是没思路

数据分析常用的7大思维方法详解

 

乙:

我们要分析的问题是销售额下降,一般来说会有内部和外部两个方面的原因内部就是自身的一些原因造成了下降,外部原因是不受我们控制的不可抗力因素内部原因我们可以参照5w2h里的几个因素,when、why、who、how等外部因素包括市场竞争、市场容量、政策等

知道了这些关键因素,我们再继续进行拆解,就能找出所有的可能原因

数据分析常用的7大思维方法详解

 

这样分析是不是感觉清晰了许多?

结构化思维方法是怎么处理这个问题呢?在面对这么一个问题时,结构化思维方法首先做的并不是立刻着手清洗数据。

而是根据对业务的理解,先为数据分析画一个思维导图,它的作用相当于你来到一个陌生的城市拿出百度地图查询乘坐交通工具到入住的酒店的路线图。

这个思维导图就是一个知道你到达目的地的路线图。

事实上,结构化思维就是由麦肯锡提出的著名的“金字塔思维”,如下图就是典型的结构化:

数据分析常用的7大思维方法详解

 

无论是作为表达者、或者是信息接受者,都要先建立起符合金字塔结构的框架,然后按照逻辑、顺序等进行重点内容阐述

而关于金字塔结构,我理解的关键核心就是“主要-重要-次要”

其中的“主要”就是明确中心思想,对此书中提出了4种要求:“结论先行、以上统下、归类分组、逻辑递进”,这也是金字塔原理的四个原则

其中的“重要”就是在建立金字塔结构时,一定要遵守先重要后次要、先全局后细节、先结论后原因、先结果后过程的原则进行内容安排

最后的“次要”就是要把无关的、逻辑性差的、相关性低的因素和内容筛选出去

更详细来讲就是:

结论先行:中心思维要放在最前面以上统下:上一层一定要是对下一层内容的总结归类分组:每组的思想要属于同一逻辑范围逻辑推进:每组的顺序要按照一定的逻辑关系

归纳与演绎

首先什么是归纳和推理?我直接简单举个例子就行了:

归纳:树能燃烧、纸能燃烧、筷子能燃烧,所以木制品能够燃烧

推理:木制品能够燃烧,筷子属于木制品,所以筷子能够燃烧。

数据分析常用的7大思维方法详解

 

很显然,归纳是从个体属性出发,寻找因子之间的共性,总结出一个一般的特性

而演绎则相反,是从一般整体出发,寻找事物之间的逻辑,从而得到某个个体的特性

在实际的业务分析场景中,我们会潜移默化的用到演绎和归纳思维,比如说演绎法,我们最常见的就是三段论:大前提、小前提和结论

数据分析常用的7大思维方法详解

 

但是演绎法要注意避免一个大误区:比如“最近公司利润率下降,是因为成本过高,所以我们要降低大家的薪资。”

首先这个论断是基于演绎法的三段论,每一段论之间的逻辑关系都是正确的,利润率确实与成本过高有关,而成本自然也包括人力薪资的成本,看似好像逻辑紧密,但如果这个论断是真的,可能每个公司都会用这个理由裁员降薪了

问题出在哪呢?

明明每一段轮之间的关系都是有逻辑的,问题就出在大前提和小前提之间的论证是否真的有说服力

比如说公司的利润率是否仅仅是因为成本过高?这是大前提的论证

成本过高是否只能降低大家的薪资?这是小前提的论证

很显然,这两个前提的论证过程是不严密的,因此会出现逻辑上的不通。

数据分析常用的7大思维方法详解

 

那么归纳法就比较简单了,归纳法是从结果出发,寻找原因,通过观察对比、分析,找到事物之间因果关系的一种方法

同样的,归纳法也要注意一个误区:黑天鹅事件

农场主每天早上7点准时到鸡场里喂鸡,久而久之火鸡们都得出了一个结论就是农场主每天7点都会来喂鸡,但是圣诞节这天等到火鸡们的却是一把刀。

数据分析常用的7大思维方法详解

 

这就是归纳法的一个致命误区,也就是以偏概全,我们无法阻止黑天鹅事件的发生

相关思维

在大数据时代,核心就是相关思维,这种思维是建立在相关分析的基础上。

啤酒与尿布的故事,是一个相关分析的经典案例。

数据分析常用的7大思维方法详解

 

这个故事产生于20世纪90年代的美国沃尔玛超市中,当时沃尔玛拥有世界上最大的数据仓库系统

为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些

沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘,一个意外的发现是:

跟尿布一起购买最多的商品竟是啤酒

经过大量实际调查和分析,揭示了一个隐藏在「尿布与啤酒」背后的美国人的一种行为模式:

在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒

产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

举个简单例子,一般来说女性去超市买的东西是化妆品、服装、时蔬等等,而男性去超市买的东西大多是日用品,所以超市里会设置女性专柜和男性专柜,通过简单的客户分群实现商品分类。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python金融大数据挖掘与分析全流程详解是一本介绍如何使用Python进行金融大数据挖掘和分析的书籍。该书详细介绍了从数据获取、数据清洗、数据分析到数据可视化的全流程,包括Python中常用数据分析库和算法。通过学习本书,读者可以掌握如何使用Python进行金融数据分析和挖掘,提高自己的数据分析能力。 ### 回答2: Python金融大数据挖掘与分析是目前金融行业普遍采用的技术。该技术通过海量数据的分析、探测和挖掘,为金融行业打造出了一个完整的全流程分析挖掘平台。以下是Python金融大数据挖掘与分析全流程的详解: 一、数据收集阶段 在这个阶段,要确定数据来源、数据处理等问题。数据来源最常见的是从金融市场、互联网、文件系统等地方获取数据。通常情况下,要对收集到的数据进行清洗、处理、过滤等操作,保证数据的质量。 二、数据预处理阶段 在这个阶段,需要对数据进行清洗、特征选取、降维等操作,同时还要对数据进行规范化处理,以便更好地进行后续分析。此外,数据预处理还包括对缺失数据的处理。 三、数据探测与挖掘阶段 数据探测与挖掘是整个过程中最重要的一个阶段。在这个阶段中,需要使用各种挖掘算法,如聚类算法、分类算法、回归算法等,对数据进行挖掘、探测和分析。同时也要用到统计分析、预测模型等技术。 四、模型评估、选择和优化阶段 在模型评估、选择和优化阶段中,需要把模型的预测结果与实际结果进行比较,以评估模型的准确性、可靠性和实用性。如果模型不是很理想,就需要对模型进行优化和选择,使之能够更好地适应实际需求。 五、应用与部署阶段 在这个阶段中,需要应用已经开发好的模型和算法,进行实际的业务分析和决策。同时还要考虑如何整合已有系统,以实现更高效、更精准地业务部署。 总的来说,Python金融大数据挖掘与分析全流程包括了数据收集、预处理、探测和挖掘、模型评估和选择、优化、应用和部署等一系列环节。Python金融大数据挖掘与分析已经成为金融行业不可或缺的一部分,极大的促进了金融行业的数字化转型. ### 回答3: Python金融大数据挖掘与分析全流程详解 在金融行业,大数据分析已经成为一个必要的分析方法和技能。Python编程语言,因其易学易用,成为了金融数据分析中必须掌握的语言之一。本文将介绍Python金融大数据挖掘与分析全流程,并且详细讲解每个步骤。 1. 数据收集 数据收集是数据分析的基础,Python提供了许多方法进行数据收集。在金融领域,最常使用的数据源是金融行情数据、公司财务报表数据、社交媒体数据等。我们可以通过API接口或者爬虫技术来获取这些数据。 2. 数据预处理 在进行数据分析之前,需要对所收集到的数据进行预处理,以保证数据的质量和完整性。数据预处理包括缺失值处理、异常值检测与处理、数据清洗等步骤。Python提供了丰富的库和函数来进行数据预处理操作,如Numpy、Pandas等。 3. 特征工程 特征工程是将原始数据转换成适用于机器学习算法的特征的过程。特征工程是数据分析中重要的一步,特征选取的选择会直接影响到模型最终的效果。在Python中,我们可以使用Sklearn等库来进行特征工程。 4. 数据建模 数据建模是整个分析流程中最重要的步骤之一,也是最复杂的步骤之一。在Python中,我们可以使用Sklearn等机器学习库进行数据建模。常见的算法包括线性回归、分类算法、聚类等算法。 5. 模型评估与调优 模型评估与调优是对所建模型进行验证和优化的过程。可以通过交叉验证、ROC曲线等方法对模型进行评估。通过调优参数或者使用其他算法,进一步提高模型的效果。 6. 数据可视化 数据可视化是将所得到的数据进行生动形象地展现,便于理解和分析。可以通过Matplotlib、Pandas等工具进行可视化。 7. 结论汇报 结论汇报是将所做的数据分析过程和结论,通过可视化和语言的形式呈现给相关的利益相关方。这个过程需要清晰、明确的表达结果和推论。通过Python中Jupyter notebooks、Pandoc、Ipython等工具可以产生结论汇报的文档和报告。 总结 以上就是Python金融大数据挖掘与分析全流程,包括数据收集、数据预处理、特征工程、数据建模、模型评估与调优、数据可视化和结论汇报。Python作为一个简洁、易学易用的编程语言,深受金融数据分析从业者的喜爱。但是在进行金融数据分析时,也需要具备丰富的金融理论背景和专业技能,才能够更加深刻地理解数据的背后故事以及更好地挖掘数据的价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值