自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据之魅的博客

微信公众号:数据之魅。数据科学,魅力无限。欢迎关注

  • 博客(86)
  • 收藏
  • 关注

原创 你必须要了解的8种数据分析思维

作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现:“好像是A引起的” ,“好像也和B渠道有关”,“也可能是竞争对手C做了竞争动作”等主观臆测。面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。很显然,这样的思维是乱的,所以做数据分析很重要的一点是:要具备结构化的分析思维。01一、结构化思维:结构化思维让你分析效率加倍相信很多人都听说过“金字塔原理”。那额我们就来了解一下基于金字塔原理衍生的“结构化思维”吧。 什么是结构化思维?结构化思维是指一个人在面对工

2022-12-03 22:15:46 305

原创 数据分析入门必看|数据分析到底应该学什么?

基于一些数据分析方法,如象限法、多维法、假设法、指数法、二八法、对比法、漏斗法,在特定业务场景下,还衍生了通用的业务分析模型,常用的有购物篮分析模型,RFM 模型,漏斗分析模型,客户生命周期,以及预测、聚类分析等挖掘模型。做数据分析,数据从哪里来?初入门阶段,只需了解常用的数据库类型,能够在现有的表格里面查询出数据,知道怎么用和处理数据,把数据变得规整就行。在之前的分享内容里,是为了让大家更快上手入门去学习使用的,本次内容合计里,每个模块会介绍的相对更加细节一些,同时也会更深入一些,希望对大家有帮助。

2022-11-22 09:59:41 1181

原创 分享 | 运营必备11大数据分析模型,建议收藏

数据运营能力已经被公认为运营人员的加分项甚至是必备技能,其高低也在很 大程度上决定着运营人员的薪资高低和职业生命周期的长短。一方面,它能大幅提 升运营人员的工作效率;另一方面,它能更全面和深入地分析运营工作,从而更好 地辅助策略、指导实践。

2022-09-12 17:13:06 1836

原创 如何快速分析一个问题?

通过大量分析数据、资料以及内部的研究报告,收集足够多且可以作为基础证据的事实,对问题进行详细论证、说明,并在总结出问题的最初假定之后,对收集到的所需事实进行适当的分析,能够最后得出对最初的假定进行支持或者反驳的结论,将分析的结果与一些富有创造性的思维结合起来,就能够最终找出解决问题的方法。逻辑树分析法是将问题中涵盖的所有子问题,没有疏忽和遗漏地进行分层罗列,从最高层逐步向下扩展并逐渐细化,直到找出解决问题的方法。而从已掌握的现状通过分析得到结果,绝大部分依靠的是以事实为基础的分析问题的能力。......

2022-08-28 11:42:49 585

原创 数据分析面经分享 | SQL如何查询用户的最长连续活跃天数?

当我们对产品进行用户行为分析时,会比较关注留存相关的指标,我们希望用户能每天使用我们的产品,那么除了常规的计算用户次日、3日、7日...n日留存率之外,我们该怎么分析一个用户连续登陆的天数呢?我们来一步步拆解。PART 01 用户活跃数据用户活跃表我们有一个用户活跃表,假设每天用户只有一条登陆信息(如有多条,视实际情况处理),表结构如下:CREATE TABLE `user_active`( `uid` string, -- 用户ID `ac...

2021-03-28 22:33:26 2882

原创 数据分析系列 29/32 | 数据分析面试简历知多少?

您与该职位不太合适,无法进入面试阶段。建议参考STAR法则对简历进行修改,并突出您在专业知识方面的优势。PART 01 STAR法则投简历的时候,相信大部分人可能会遇到上面的拒信,那么什么才是STAR法则呢?所谓STAR原则,即Situation(情景)、Task(任务)、Action(行动)和Result(结果)四个英文单词的首字母组合。STAR原则是结构化面试当中非常重要的一个理论。 S指的是situation,中文含义是情景,也就是在面谈中我们要求应聘者描述他在所从...

2020-09-13 22:44:53 373

原创 数据分析系列 28/32 | 如何用一份优秀的数据分析报告来迎接新年?

在做数据分析项目的时候,在项目完结之时,一般都会要求出一份完整的数据分析报告。按照应用场合可以划分多种类型:有的需要向上邮件汇报,有的需要给项目组里一个交代,有的是需要直接进行展示汇报等。按照项目类型也可以划分多种类型:新项目上线效果评估,AB test结果,日常数据汇总,活动数据分析等。不管是文本还是PPT,数据分析报告的核心思路都是相通的。PART01 数据分析报告的框架前面我们介绍了数据分析的步骤, 数据分析系列 2/32 | 数据分析六连环 今天再着重说一下报告的框架和其他思想。...

2020-09-13 22:40:53 208

原创 UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe6 in position解决方法

原因是:python的str默认是ascii编码,和unicode编码冲突,解决方法是设置utf-8;import sysreload(sys)sys.setdefaultencoding('utf8')

2020-07-04 05:50:32 7077 5

原创 解决ImportError: cannot import name “imread” from “scipy.misc”

如图所示,大家在使用imread时可能会出现以上报错。为了解决以上问题,目前试过有两种方法是有效的:1、安装低版本的scipy先查看自己的scipy版本:In [21]: import scipy In [22]: print(scipy.__version__) 1.4.1

2020-06-22 07:06:28 3453

原创 sublime Text3去除文本重复行

去除重复行的方法很多,如Excel里的删除重复项。这里通过sublime正则表达式实现。打开Word2010打开Word2010打开Word2010打开Word2010打开Word2010重复输入的文本重复输入的文本重复输入的文本重复输入的文本重复输入的文本关于幸福关于幸福关于幸福关于幸福关于幸福关于幸福关于幸福系统会自动替换为设定的内容系统会自动替换为设定的内容系统会自动替换为设定的内容系统会自动替换为设定的内容正则表达式(.*)(?=.*\

2020-06-10 20:11:12 5564

原创 数据分析系列 27/32 | Python使用matplotlib实现数据可视化

俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。PART01 Matplotlib现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。今天我们的主角是Python中的matplotlib库(官网:http:// matplotlib.org),相对来说,matplotlib功能不是最强大的,但是对于基本的图形...

2020-06-10 07:37:00 382

原创 数据分析系列 26/32 | Python数据科学速成(二)

接上文。PART01 面向对象编程现在有很多的的语言支持面向对象,比如最多的JAVA,PHP等,当然,Python也不例外,Python允许你来定义类(class)。类可以封装对象和函数来对它们进行操作。有时候我们会用类来使代码更加干净整洁,解释类的用法的最简单的方式可能是构建一个有很多注释的例子。如果Python中没有集合,那我们就需要自己去创建Set类。要实现的功能有:给定一个Set,我们需要能在其中加入(add)项目,移除(remove)项目,以及检查其中是否包含...

2020-05-15 07:39:34 327

原创 数据分析系列 25/32 | Python数据科学速成(一)

前面一篇讲了一些Python的基础知识和概念,这一篇我们来了解一下Python中更高级的部分,这些特性对开展数据工作特别有用。PART01 排序和列表解析排序每个Python列表都有一个sort方法恰当的排序,如果你不想弄乱你的列表,可以使用sorted函数,它会返回一个新列表。x = [2, 1, 4, 3]y = sorted(x) #结果是[1, 2, 3, 4]x.sort() #x变为[1, 2, 3, 4]默认情况下,sort...

2020-05-14 22:50:46 243

原创 数据分析系列 24/32 | Python数据科学库的安装和numpy介绍

如何使用Python进行科学计算和数据分析,这里我们就要用到Python的科学计算库,今天来分享一下如何安装Python的数据科学计算库。PART01 数据科学计算库Python中的数据科学计算库有Numpy、Scipy、pandas、matplotlib(前面我分享了一篇matplotlib的简单应用,历史文章上一篇就是)。Numpy是一个基础性的Python库,为我们提供了常用的数值数组和函数。Scipy是Python的科学计算库,对Numpy的功能进行了扩充,同时也...

2020-05-14 22:20:45 312

原创 idea、PyCharm连接MySQL错误如何解决?

大家在使用Idea、PyCharm连接MySQL时,可能会遇到以下报错:Server returns invalid timezone. Go to'Advanced' tab and set 'serverTimezone' property manually.今天整理一下几种解决办法供大家参考。首先,我们来定位原因:原因:服务器返回无效时区,转到“高级”选项卡并手动设置“serverTimezone”属性。首先,出现该问题的原因是MySQL驱动jar中的默认时区是UTC。.

2020-05-10 14:37:01 424

原创 Idea、PyCharm连接MySQL报错: Server returns invalid timezone. Go to 'Advanced' tab and set 'serverTimezone

Idea、PyCharm连接MySQL报错:Server returns invalid timezone. Go to 'Advanced' tab and set 'serverTimezone' property manually.原因:服务器返回无效时区,转到“高级”选项卡并手动设置“serverTimezone”属性。(首先,出现该问题的原因是MySQL驱动...

2020-05-07 15:29:51 1865

原创 数据分析系列 23/32 | 数据分析必须学习的6种数据分析思维

作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现:“好像是A引起的” ,“好像也和B渠道有关”,“也可能是竞争对手C做了竞争动作”等主观臆测。面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。很显然,这样的思维是乱的,所以做数据分析很重要的一点是:要具备结构化的分析思维。PART01 偏结构化思维逻辑树思维(...

2020-05-02 14:30:25 725

原创 数据分析系列 22/32 | 9种常用的数据分析方法

要使各种结构化的、非结构化的、海量的数据实现标准化、信息化,能够提供业务绩效评估、业务决策支持等要求,我们首先需要进行数据分析。同时,围绕业务问题,采用合适的分析方法,分析模型,以及分析工具,这是数据分析师的必备技能。这里介绍了一些常用的数据分析方法供大家参考。PART01 一般统计类一、描述性统计描述性统计是一类统计方法的汇总,揭示了数据分布特性。它主...

2020-05-02 14:22:30 1331

原创 数据分析系列 21/32 | Excel制作数据报表实践

前面我们介绍了几种常用的数据图表,今天分享下我们如何使用Excel制作想要的图表。PART01 Excel制作图表工具 Excel中集合很多有用的工具,这里不一一赘述了,今天就来看一下我们要用的图表功能,打开Excel之后,在“插入”——“图表”模块就可以看到我们所需要的内容。在这里我们可以选择适合的图表,当我们选中数据单元格时,可以点击“推荐的图...

2020-05-02 11:57:12 732

原创 数据分析系列 20/32 | 如何选择合适图表来传达信息?

面对多种类型的图表,选择合适来传达我们想要表达的信息至关重要,今天分享下我常遇到和使用的可视化图表。PART01 常见图表及用途折线图:折线图应该用于比较一段时间内的值,非常适合显示大小变化。它们还可用于比较多个数据组的更改。条形图:条形图应用于比较几个类别的定量数据。它们也可用于跟踪数据随时间的变化,但最好仅在这些变化很重要时使用。...

2020-03-26 14:18:25 881

原创 数据分析系列 19/32 | 数据可视化初探

俗话说得好,一图胜千言。数据可视化是数据科学中的一个重要部分。创建可视化很简单,但是创建优秀的可视化很难。数据可视化有两种主要用途:探索数据和交流数据。PART01 数据可视化 现在有很多工具都可以用来可视化数据,比如我们常用的Excel,还有数据科学另一门重要的语言R,以及百度的Echarts等可视化工具。说到这里,说一个经典的可视化案例:俄法战争。...

2020-03-26 14:16:18 423

原创 数据分析系列 18/32 | MySQL中的数据分析函数实战

数据分析系列 17/32 | MySQL中的数据分析函数,在前面我们对MySQL中的数据分析函数有了了解,今天我们就来看一下数据分析函数的实际应用。PART01 基础数据准备假设我们有一张会员订单表,表里包含了如下字段:订单id,订单金额,会员id,订单创建时间,订单状态等。CREATE TABLE dm_order_2018( id varchar(100)...

2020-03-26 14:12:36 249

原创 数据分析系列 17/32 | MySQL中的数据分析函数

在日常的数据分析工作中,我们可能会经常遇到类似这样的需求:环比如何计算?怎么样得到各部门工资排名前N名员工列表?查找各部门每 人工资占部门总工资的百分比?对于这样的需求,使用传统的SQL实现起来比较困难。这类需求都有一个共同的特点,需要在单表中满足某些条件的记 录集内部做一些函数操作,不是简单的表连接,也不是简单的聚合可以实现的,通常会让写SQL的同学焦头烂额、绞尽 脑汁,费了大半天...

2020-03-26 14:07:50 229

原创 数据分析系列 16/32 | MySQL中子查询与联合查询

前面说了很多MySQL中的查询,比如条件查询、分组聚合查询、连接查询,今天来说一下另外两个非常的重要的查询,MySQL中的子查询和联合查询。PART01子查询子查询也称嵌套查询,是将一个查询语句嵌套在另一个查询语句的WHERE子句或者HAVING短语中,前者被称为内层查询或子查询,后者被称为外层查询或父查询。在整个SELECT语句中,先计算子查询,然后将子查询的结果...

2020-03-26 13:57:52 260

原创 数据分析系列 15/32 | MySQL连接查询三板斧

前面我们学习了MySQL的一些查询,但是都是针对一个表进行查询,当我们查询的表大于1个,则称为连接查询。连接查询是关系数据库中重要的查询方式,包括交叉连接、内连接、和外连接。PART01 交叉连接交叉连接(CROSS JOIN)又称笛卡尔积,即把一张表的每一行与另一张表的每一行连接起来,返回两张表的每一行相连接后所有可能的搭配结果,其连接的结果会产生一些没有意义的记录,所以...

2020-03-23 23:02:09 352

原创 数据分析系列 14/32 | MySQL查询数据练练练

在数据库应用中,最常用的操作是查询,查询的用途就是获取我们想要的数据。今天分享下MySQL中查询SELECT语句。PART01 MySQL中常用查询SELECT语句使用SELECT语句可以在需要时从数据库快速方便地检索、统计和输出数据。SELECT语句功能强大、使用灵活,其属性理论基础是关系数据模型中对表对象的一组关系运算,即选择(selection)、投影(proje...

2020-03-23 22:59:35 238

原创 数据分析系列 13/32 | MySQL定义数据库与数据类型

数据类型(data type)是指系统中所允许的数据的类型。不同的编程语言所包含和允许的数据类型是不一样的,数据库中每个字段都应有适当的数据类型,用来限制或允许该字段中存储的数据。PART 01创建数据库MySQL中创建数据库的语法是:CREATE{DATABASE|SCHEMA}[IFNOTEXIST]db_name[[DEFAULT]CH...

2020-03-18 13:20:11 266

原创 数据分析系列 12/32 | MySQL常用函数知多少?

MySQL函数是MySQL数据库提供的内置函数,这些内置函数可以更方便处理表中的数据。下面简单介绍一下MySQL中包含的几类常用函数。PART 01聚合函数聚合函数可实现根据一组数据求出一个值,聚合函数的结果值只根据选定数据行中非NULL值进行计算,NULL值被忽略。COUNT()函数COUNT()函数,对于除“*”以外的任何参数,返回所选择集合中非NULL值的行...

2020-03-17 10:28:05 384

原创 数据分析系列 11/32 | Excel方差分析之双因素方差分析

前面我们说了方差分析中的单因素方差分析,但是在实际工作中,影响因素往往不止一个,需要考虑两个或以上因素对实验结果的影响。比如某公司销售汽车,在销售时,除了要关注汽车的外形、价格、耗油量等因素以外,还要考虑地区差异是否对销量有影响。今天来看一下双因素方差分析。PART 01双因素方差分析如果将汽车颜色看成是影响销量的A因素,不同地区看成是影响销量的B因素,同时对A因素和B因素进行分析...

2020-03-16 17:24:33 1909

原创 数据分析系列 9/32 | Excel进行回归分析,预测真实值

前面学习了Excel中的相关分析,在数据分析中,相关分析和回归分析关系紧密,今天来学习下Excel中的回归分析。PART 01回归分析回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。  我们在得到两组数据之间的相关程度之后,就可以使用回归分析进行预测了,换言之,相关分析是回归分析的基础和前提,回归分析是相关分析的深...

2020-03-16 17:17:04 3059

原创 数据分析系列 8/32 | Excel相关分析,查看业务发力点

前面我们进行数据分析时,我们已经通过描述统计找到了数据的内在规律,但是在实际工作的时候,我们除了分析数据的规律外,最重要的是预测未来的数据。我们为什么要数据分析,最终的目的都是为了预测,基于现有的历史数据,来预测未来的发展状况。但是预测不能只靠想,这时候我们就必须使用数据工具中的相关分析和回归分析。PART01相关分析相关分析(correlationanalysis),相关分析是研...

2020-03-16 17:15:38 579

原创 数据分析系列 10/32 | Excel方差分析之单因素方差分析

无论是什么活动,影响产品质量和产品的因素都有多种,如影响农作物产量的因素有品种、天气、施肥量、肥料的种类等等。如果我们想要了解这些因素中哪些因素对产量有显著性影响,或各个因素之间的交互作用,以及对结果有显著影响的因素的最佳水平等,就必须先进行实验,再进行分析,最后做出判断。PART01Excel中的方差分析方差分析(Analysis of Varia...

2020-03-16 17:11:58 1725

原创 数据分析系列 7/32 | 查找数据?VLOOKUP是专业的

时年 34 岁的 Excel 叔叔函数 VLOOKUP 要退休了。据微软统计,这是Excel中排名仅位于 SUM 和 AVERAGE 之后第三常用的函数 VLOOKUP。让我们再来回顾一下VLOOKUP的使用方法吧。PART01常用的查找与引用函数Excel中的查找与引用函数有多种,这里按照使用频率的高低和与工作的相关性大小,介绍几个常用的查...

2019-12-24 07:03:01 490

原创 数据分析系列 6/32 | 数据统计第一步:分类汇总

在Excel众多的统计函数中,有一种函数集合了上述常用的统计函数,它就是SUBTOTAL函数,该函数是功能强大的分类汇总统计函数。PART01SUBTOTAL函数SUBTOTAL函数的语法格式为SUBTOTAL(function_num,ref1, ref2, ...)。其中function_num是1~11或101~111的数字,每个数...

2019-12-24 07:01:57 645

原创 数据分析系列 5/32 | Excel中必备的统计函数

前面已经说了很多基础的知识,今天我们来说一下Excel中在工作中常用的统计函数。统计工作是我们工作中必不可少的重要环节,整个过程如下所示。由此可见统计分析的核心工作就是对前两项工作的完善,而统计整理的工作则是统计过程中举足轻重的一环。PART01统计过程关系统计整理工作要借助一定的统计工具才能顺利开展。比如SQL,SPSS,Excel等...

2019-12-24 07:00:57 338

原创 数据分析系列 4/32 | 数据分析必知统计学

对于想入门学习数据分析的同学来说,大家基本都知道数据分析指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。那我们今天就来聊一下统计的相关内容。PART01统计及其应用领域1)什么是统计学统计学(statistics)是收集、处理、分析、解释数据并从数据中得出结论的科学。数据分析...

2019-12-04 10:10:03 608

原创 数据分析系列 3/32 | 数据分析需要掌握的常用指标

数据分析相关概念多且杂,容易搞混。为了便于大家区分,今天小编就来盘点一下数据分析常用的指标解释。建议大家收藏起来方便查看。PART01互联网相关1、PV(Page View)页面浏览量指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用...

2019-12-04 10:01:58 793

原创 数据分析系列 2/32 | 数据分析六连环

我们了解了数据分析定义和作用,那么,数据分析具体怎么开展呢?我们需要做什么?怎么去做?PART01数据分析6步曲概括的说,数据分析的过程主要包括6个步骤:明确分析目的和思路、数据收集、数据预处理、数据分析、数据展现和报告撰写。如下图所示:图1 数据分析6步曲1)明确分析目的和思路做任何事都要有个目标,数据分析也不例外。在进...

2019-12-04 09:53:25 269

原创 数据分析系列 1/32 | 数据分析入门理解

PART01“数据分析”是什么?大数据时代,人人都在说数据分析。那么,数据分析是什么?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。(via 百度百科)即使有了一个定义,其实不同的...

2019-12-04 09:52:15 280

原创 Windows10关闭任意门检查更新

在Windows10开机时,几乎每次都弹出一个框,上面写着“无法从服务器获取最新更新,请稍后重试”。既然每次都获取不到,还更新啥呢。不如关了省心。让我们关闭它不再提醒吧。编辑——首选项——从不——确定!好了,完成。小结希望通过上面的操作能帮助大家。如果你对数据分析等感兴趣。欢迎关注微信公众号,访问更多精彩:数据之魅。如需转载,请联系授权,谢谢合作。...

2019-07-16 23:25:54 1102

Python基础知识.pdf

Python基础知识、思维导图、知识要点

2022-11-14

项目管理在汽车行业的应用.pptx

项目管理在汽车行业的应用,

2022-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除