数据分析
文章平均质量分 92
进击的可乐!
公众号【可乐的数据分析之路】。出版书《Excel数据处理与分析——数据思维+分析方法+场景应用》
展开
-
数据分析之历史上的百年奥运
2020东京奥运会已经结束了,才想起来写一篇关于奥运会的数据分析文章,真是前些天都太热衷于追奥运了。找了一下,网上果然有从1896第一届现代奥运会开始至2016年里约奥运会的全部数据,当然如果你感兴趣,还可以把2020年的给加上,于是,我们就可以用这些数据来重新回顾一下这100多年来的奥运会历史了!01 提出问题奥运会,全称:奥林匹克运动会,发源于2000多年前的古希腊,因举办地在奥林匹亚而得名,每4年一届,是世界上影响力最大的体育盛会。1896年,停办了1500年的奥运会终于得以重办,这也是首届原创 2021-08-11 22:05:08 · 1857 阅读 · 0 评论 -
数据会说谎的真实例子有哪些
今天参加了知乎的线下活动——快闪课堂主题:数据会说谎吗?主讲人:程毅南(知乎心理学、互联网话题优秀回答者,73万关注)我们为什么需要数据因为要决策因为要科学、准确地决策,并解决实际问题什么是科学地搜集数据世界客观存在,但需要人去发现和认知数据是连接客观世界和主观认知的桥梁,但修桥是个技术活搜集数据有什么难处人的想法和感受很难丈量我爱你,你有多爱我为什么我爱你很难回答,因为爱的程度无法用工具测量用得分或数字表达,都极易失真,缺乏信度爱的状态本身就不稳定,但是测量时的状态原创 2020-12-29 14:21:32 · 1296 阅读 · 0 评论 -
数据分析方法论3:综合指标分析法
之前提到的对比、平均、分组和交叉的分析思路,都是在单一指标下分析的方法。而综合指标评价法是建立在复杂数据情况下,将多个指标的转化为一个综合指标对某一特征进行总体评价,如人民的幸福程度、人才评价、用户活跃程度等,这种方法经常出现在行业报告中。极光数据在2019年8月19日发布的APP流量价值评估报告中,就用到了综合指标分析方法。首先构造了流量价值这个综合指标,然后从四个维度:用户规模、流量质量、用户特征和产品特性分别选取相应指标。权重是如何确定的、具体值是多少,我们就不得而知了,只能看到它的.原创 2020-12-17 16:54:19 · 5824 阅读 · 0 评论 -
数据分析方法论2:交叉&平均分析法
交叉分析 and 平均分析平均分析法平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。01 不得不提的平均数平均数用来反映一组数据的集中趋势,表示平均的指标有算术平均数、几何平均数、中位数和众数。算术平均数最常用的一个平均数,也就是常说的均值、平均值,就是我们熟悉的那个求平均值的公式,所有的数值相加再除以总个数:x=i=1nxin算术平均数受极值的影响较大,当数据集...原创 2020-12-17 16:44:19 · 4638 阅读 · 0 评论 -
数据分析方法论:不可不知的分组分析法
分组分析是将总体数据按照某一特征性质划分成不同的部分和类型进行研究,从而深入分析其内在规律。为什么要分组?对于大量的数据,如果不进行分组是很难发现其中规律,找到不同组别之间的关系,从而更好地对比,如下图的人口分布图,如果不对人口的年龄段进行分组,是没法进行分析的。(图片来源:中国统计局)文本数据的分组分析文本数据即非数值型数据,对文本型数据进行分组可以说明事物的特征,如对性别、教育水平等指标进行分组。(图片来自中国统计局-国家数据)数值型数据的分组分析指令...原创 2020-12-17 16:34:21 · 2837 阅读 · 0 评论 -
数据透视表,一篇就够了
这一篇文章助你学懂数据透视表目录一、创建数据透视表二、数据透视表字段列表三、分析四、设计首先,我们要知道应用数据透视表的前提:数据量规范,需要汇总,且可随时对其形式进行变更。一、创建数据透视表1、数据源的选择:要进行透视的数据区域全选,或只选择其中的一个单元格。2、数据透视表位置的选择:默认是将数据透视表放到一个新的工作表里,也可以手动选择现有工作表的某个位置。二、数据透视表字段列表行标签(行字段):可以有多个行字段,并自由排列顺序...原创 2020-12-16 16:28:03 · 5061 阅读 · 0 评论 -
Excel有哪些相见恨晚的技巧?
总结了11个Excel中不得不知的技巧,另附一张工作中常用的快捷键汇总图。1、格式刷单击格式刷可以临时一次将前一个单元格的格式应用到当前单元格,双击格式刷可以一直应用。2、快速填充快速填充的功能除了大家熟知的最基础的填充序号编号日期以外,还可以进行分列、合并的操作,当然前提是Excel版本为2013版及以上。快速填充的快捷键是ctrl+E,这个功能可以说是解放了文本函数,让left/right等函数都没有了用武之地,比如从身份证号码中提取出生日期等等操作,大家可以试一下。3、分列分列这个功能我觉原创 2020-12-16 16:17:57 · 273 阅读 · 0 评论 -
2020年出生人口会大跌吗?解读人口数据
2020年马上就要过去了,今年的人口普查是一个大事,在2019年官方公布的出生人口为1465万的前提下,大家也尤为关注2020年的出生人口,这篇文章就来讲解一下有关人口的各种数据。第一部分:人口数据首先我先了解了一下我国历年来的人口数据,从国家统计局(http://www.stats.gov.cn)公布的数据上可以看到1949年以来至2019年的人口出生率、死亡率和自然增长率(出生人口可以用总人口与出生率相乘得到)。欲看懂这个图,得先知道以下几个概念:人口普查:要说明一下1982、1990、2.原创 2020-12-14 22:22:53 · 17636 阅读 · 2 评论 -
指标又双叒下降了,我到底该怎么给老板分析?
界定问题首先要界定问题,可以从3个方面来看数据来源及准确性要明确该指标的数据来源,以排除是否是数据源出现的问题还要明确指标的准确性,是否是人为写错这样的问题现状分析明确了数据来源及准确性后,对现状进行一个分析,可从以下3方面进行:明确指标的含义明确这个指标在业务层的含义,是了解这个指标的第一步现状如何这个指标现阶段是什么样的,这是突发事件吗,以及以前是否发生过类似的事情变化是否异常该指标的变化是否在正常的波动范围内?对比分析进行完现状分析后,再进行对比分析,可从以原创 2020-12-05 15:16:19 · 220 阅读 · 0 评论 -
18个常见的数据分析面试题-概率统计类
总结了一些常见的概率与统计类的数据分析面试题,不定期更新……随机变量的含义一个随机事件的所有可能的值X,且每个可能值X都有确定的概率P,X就是P(X)的随机变量。比如掷骰子中出现的点数随机变量和随机试验间有什么关系随机试验:相同条件下对某随机现象进行的大量重复观测的试验,如掷硬币100次统计正面朝上的次数 随机变量是用来描述随机试验结果的。划分连续型随机变量和离散型随机变量的依据离散型随机变量:随机变量X能被一一列举出来,如一批产品中次品的数量,某地区人口的出生数等。原创 2020-11-17 06:07:32 · 3652 阅读 · 2 评论 -
数据分析工具
数据分析的工具有很多,从数据分析岗位的描述里其实就能发现企业都需要会哪些工具的人,这里我分成了4类来聊聊。分别是基础、可视化、专业的统计分析以及编程语言。基础说到数据分析的基础的工具,非Excel莫属。Excel微软办公系列的重要组成之一,任何办公人员都会用到的神器,不得不说它的体系太庞大了,在人力、金融、管理等多个领域都会应用,同样对数据分析人员来说,也可以进行各种数据处理和分析。特点:表格制作:简单的表格录入、制作、美化。透视表:实现数据透视的效果,可以说学会数据透视表,基本可以解决原创 2020-11-02 20:29:53 · 596 阅读 · 0 评论 -
教你用算法找对象、指导工作与生活 | 算法之美
哈喽大家好,我是可乐。今天给大家推荐一本我之前发朋友圈预告的内容:《算法之美》的读后感。趁着1024程序员狂欢节当当大促,我又买了《统计之美》,《算法之美》这本书的副标题是,指导工作与生活的算法,它在告诉我们计算机算法也可以用来解答人类面临的种种问题。(文末是这本书的知识图谱)我们所有人的生活都受到有限空间和有限时间的限制,因此常常面临一系列难以抉择的问题。在一天或者一生的时光里,哪些事是我们应该做的,哪些是应该放弃的?我们对杂乱无序的容忍底线是什么?新的活动与熟悉并喜爱的活动之间如何平衡,才能原创 2020-10-29 21:10:56 · 551 阅读 · 1 评论 -
2020年小红书校招数据分析笔试题详解
1、如果在小红书商城中某一商户给一产品定价,如果按照全网最低价500元定价,那么客人就一定会选择在此购买;价格每增加1元,客人的流失的可能性就会增加1%。那么该商户给客人报出最优价格为()A、520B、535C、550D、565答案:C解析:要求定价为多少时,利润能最大。设价格涨幅为x,利润为y,M为顾客数未知,但是一个固定值。求二元一次方程y=M(1-x/100)x的最大值。2、在一次集卡活动中,有5种不同的卡片以相同的概率出现,每分享一次笔记就可以得到一张卡片,集齐所有卡片.原创 2020-10-20 06:45:58 · 3599 阅读 · 0 评论 -
数据分析中会常犯哪些错误,如何解决?
这篇文章从数据分析的几个阶段,总结了14个我们可能会犯的一些错误,以及如何避免。数据获取阶段在数据采集/获取阶段,容易犯的错误:NO.1 采样偏差在数据采集的时候,如果不能获取到总体的数据,那就要采集到可以代表总体的样本,抽样就显得尤其重要,如果样本不具有代表性,那么得出的结论一定是有失偏颇的。举个例子 ->小红书的用户群体是年轻的女性用户为主,如果用这份数据去预测一部受众是青少年的电影票房,结果可能就不合理了。避免的方法 ->使样本能够充分代表总体。NO.原创 2020-10-09 20:13:12 · 2819 阅读 · 0 评论 -
有哪些你看了以后大呼过瘾的数据分析书?
书不在多,而在于精。我分析了知乎上推荐的数据分析类书籍的回答,最终总结了以下内容,形成了这篇文章。数据分析类的书有很多,可以按数据分析的流程分类,每个流程应该看哪些书籍。也可以按照通识类和工具类进行分类,通识类可以理解为入门读物类,工具类就是针对不同的工具必读的书籍了。还可以按照入门、进阶和高阶进行分类来阅读相应阶段的书籍。这篇文章我会根据通识类、工具类、应用类三个大分类来总结不得不看的数据分析书籍。也就是从入门到用哪些工具到实战应用三个阶段。通识类看了这么多答案,总结了这么多内.原创 2020-10-17 15:35:15 · 832 阅读 · 0 评论 -
数学之美:数学究竟是如何深入我们的生活
文末有这本书的知识思维导图不鸽大家,终于把这本书读完,来分享一下读后感。《数学之美》这本书是2012年出版,作者吴军,他的书籍还有《浪潮之巅》、《格局》等也非常有名,吴军博士在语音识别、自然语言处理,特别是统计语言模型的研究上都颇有建树。拿到书先看目录,内容包括自然语言处理、动态规划算法、人工神经网络、最大熵模型等都是我们大学接触过或平时挂在嘴边的名词,但这些名词背后的原理是什么,以及究竟是如何应用的,这本书就是吴军博士将高深的数学原理,以及数学在各个领域方面是如何应用的讲解的通俗易懂的过程。.原创 2020-08-16 15:08:04 · 279 阅读 · 0 评论 -
如何做好描述统计分析?
写在前面什么是描述性统计分析,这不仅是数据分析面试中最常见的问题,也是我们日常分析中必过的一道关卡。要把握数据的分布特征,需要从3个方面进行描述:集中趋势、离散程度和分布形状。1、集中趋势集中趋势就是指一组数据向某一中心靠拢的程度,通常有以下指标:众数对分类数据来说,众数是最适合描述其集中趋势的值,它是指一组数据中出现次数最多的变量,众数不受极端值的影响,但是可能不唯一,且当数据量较多时,才有意义。中位数对数据型数据来说,可以用中位数来描述其集中趋势的度量,中位数就是将一组数原创 2020-08-06 19:00:33 · 4946 阅读 · 0 评论 -
简单地聊聊统计学
写在前面这个系列会写一下有关统计学的知识和实际中的运用,今天这篇文章先从最基本的开始。1、什么是统计学?统计学,就是收集、处理、分析、解释数据并从中得出结论的一个学科。不管你是做什么行业,只要接触到数据,就或多或少地会应用到统计学的知识,所以,学习统计学非常有用。2、描述统计和推断统计总的来说,统计方法有两种,描述统计是对数据进行概况分析的统计方法,推断统计是用样本推断总体特征的统计方法。3、统计学中的几个基本概念总体:要研究的全部个体的集合 样本:总体中的部分元素的集合 参原创 2020-07-27 22:27:55 · 518 阅读 · 0 评论 -
细说回归分析
什么是回归我们先来聊聊历史,从回归这个词被发明的源头聊起。话说有一个叫高尔顿的生物学家兼统计学家在研究人类遗传问题时发现了一个现象:非常高的父亲,其儿子的身高往往要比父亲矮一点,而非常矮的父亲,儿子的身高也会比父亲高一些,也就是说,人类的身高从高矮两个极端移向所有人的平均值,他把这种现象称为“向平均回归(regression to the mean)”。其实仔细想想这种现象应该是正常的才对,如果不发生这种向平均值回归的事情,那么高的人后代将越来越高,同样矮的人的后代会越来越矮,那么经过一系列.原创 2020-07-02 23:02:18 · 1059 阅读 · 0 评论 -
再说相关性分析
标题叫再说相关性分析,为什么叫再说呢?因为之前说过了呗,但是一个知识点你反复咀嚼的时候就是会有不同的感悟,因此这篇文章要再来说说相关性分析。什么是相关性百度百科给的解释是:两个变量的关联程度。或者多个变量,或者变量与变量之间吧的关联程度,都可以,就是说A和B之间肯定存在着某种关系,确定的关系我们用函数就可以描述出来了,而这种不稳定、不确定、不精确变化的关系我们就称之为相关关系。比如不久前的新闻,说深圳离婚都要排号了,然后我们发现哈,越是大城市,人们的离婚率就越高,这就反映了城市化水平和离婚率原创 2020-06-25 16:36:16 · 2261 阅读 · 0 评论 -
什么是好的数据指标:精益数据分析
《精益数据分析》这本书是[加] 阿利斯泰尔·克罗尔和本杰明·尤科维奇著作,人民邮电出版社出版,2014年首发,如今过去6年,在数据分析行业依然畅销,同类型的“精益”系列还有《精益创业实战》、《精益客户开发》等书籍。这本书虽然叫精益数据分析,但实际上是讲解了在创业过程中应该关注哪些阶段,同时各个阶段要关注哪些数据指标这样的一本书,全书讲解了30多个案例、6个典型的商业模式,带领我们深入理解精益创业和数据驱动的思维模式。什么是精益数据分析第一章内容其实是对“精益数据分析”的一个解读,通过介.原创 2020-06-20 13:22:05 · 604 阅读 · 0 评论 -
如何处理偏态数据?
这是笔试/面试题系列的第2篇文章在了解何为偏态数据前,要先从正态数据说起。正态分布正态分布是自然界中广泛存在的,我们都知道它是两头低,中间高,整个形态呈现对称钟形的一个分布,之所以叫正态分布,是因为在大量连续数据测量的情况下,我们比较希望看到这种状态,一个标准的正态分布是u(均值)=0,σ(标准差)=1。从下图可以看出,横坐标代表随机变量X的一个取值,在均值(u=0)附近概率密度最大,越偏离均值,概率密度减小,不在(u-3σ,u+3σ)范围内的数据就属于统计学意义上的异常值了。..原创 2020-06-08 19:45:18 · 11314 阅读 · 0 评论 -
数据分析应关注AARRR模型的哪些指标
AARRR模型就是Acquisition(获取) Activation(活跃) Retention(留存) Revenue(收益) Refer(传播)这5个单词的缩写,对应用户生命周期中5个重要的环节,其实就是一个漏斗模型,每一个环节要怎么做不是我们讨论的重点,这篇文章是要来梳理一下AARRR模型关注的指标。1、Acquisition:获取用户首先是获取用户的阶段,用户从何处得知你的存在?通用指标是曝光量、点击量(率)、用户获取成本等,以微信公众号为例,这里比较关注的是新关注.原创 2020-05-30 16:28:44 · 872 阅读 · 0 评论 -
《深入浅出数据分析》读后感
好久没有更新读书系列的文章了,今天推荐的这本《深入浅出数据分析》是一本非常适合数据分析行业入门的读物,以章回小说的方式由浅入深地讲述数据分析从业人员要用到的方法,从实际案例出发,告别晦涩难懂的概念。文章末尾有关于这本书的知识图谱总结。深入浅出系列,同系列的还有《深入浅出统计学》、《深入浅出Python》、《深入浅出SQL》等,当然这本书读完以后强烈建议接着读《深入浅出统计学》,加深对数据分析和统计学的理解和巩固。作者:[美] Michael Milton豆瓣评分:7.5出版日期:2012年推荐原创 2020-05-27 20:13:52 · 2541 阅读 · 0 评论 -
泰坦尼克号数据分析案例实战
这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)一、明确目的1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是存在一定的规律?这是我们比较关心的,所以就要提出问题:那些人士生还的可能性大?其次了解数据,数据集总共有以下的字段原创 2020-05-23 11:56:21 · 8549 阅读 · 0 评论 -
《赤裸裸的统计学》读后感
《赤裸裸的统计学》,作者[美]查尔斯·韦兰,2013年出版,豆瓣评分8.1分,可以作为统计学入门读物很好的一本书,知识点浅显易懂,对小白非常友好,有统计专业知识的人可能会觉得干货略少。总的来说,值得一读,推荐指数4颗星。文章末尾有关于这本书的知识图谱。一、统计学是大数据时代最炙手可热的学问第一章开头提出了几个有意思的问题:基尼系数是否是衡量社会分配公平程度最完美的指标?(描述...原创 2020-04-09 18:29:52 · 1217 阅读 · 0 评论 -
如何制作高大上的图表
为什么你的报告中的图老板总是瞧不上,为什么我们觉得这图可以了,老板却总是不满意,不要你觉得,要老板觉得。很多人有一个误区,就是分析很重要,展示不重要,这就好比你有满腔的热血、满腹的才华,却茶壶里煮饺子——肚里有货倒不出。光埋头苦干有什么用,要懂得展示,懂得在合适的时机外露,你不表现,谁知道你干活了,你不表现,总有技术不如你的表现的比你好,这就是职场,残酷却现实。这一小节内容告诉你...原创 2020-03-26 22:16:15 · 824 阅读 · 0 评论 -
数据分析,除了Excel透视表,还有什么工具?
数据分析,除了Excel透视表,还有什么工具?就Excel而言,除了透视表,还有很多分析的利器,请听我缓缓道来01 高级筛选普通的筛选功能无法做到的可以使用高级筛选,高级筛选需要事先设置条件区域,条件区域分为两部分,标题行和条件行,标题行是要筛选的列字段,条件行是要筛选的条件。条件行可以有两种写法,一种是常量条件,一种是变量条件。常量条件即筛选条件为常量,如筛选品类中为“...原创 2020-03-25 20:09:17 · 1283 阅读 · 0 评论 -
描述性数据分析
一、什么是描述统计分析(Descriptive Analysis)概念:使用几个关键数据来描述整体的情况描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。Excel里的分析工具库里的数据分...原创 2018-07-22 16:33:38 · 48085 阅读 · 0 评论 -
《深入浅出数据分析》读书笔记
最近看了head first系列,重读了《深入浅出数据分析》,发现这是一本很好的书,在思维上开阔的不错,通过案例培养数据思维,把思路讲的很清楚,现总结笔记如下: 一、数据分析引言:分解数据1、确定——分解——评估——决策重在如何将一个大问题分解成若干易行的小问题,将手头的资料汇总为有用的格式。2、心智模型:你对外界的假设和你确信的观点。心智模型决定你的观察结果。统计模型取决于心...原创 2018-08-05 22:15:17 · 4172 阅读 · 0 评论 -
从QC看数据分析——入门数据分析
在数据分析的道路上越走越远阴差阳错的做了数据分析,而且一开始我还不知道自己在做的是数据分析,看了很多数据分析的书,也走了一些弯路,做了很多实践项目,突然很想把自己作为一个小白的数据分析之路的成长过程写下来。因为最近恰好在了解QC相关的东西,然后发现QC的套路居然能对标数据分析的过程,尤其是QC中各种各样的图表不就是数据可视化的东西吗,而且很多数据分析的书里面都有QC的影子,觉得QC实在是一大神...原创 2018-12-15 23:00:24 · 2955 阅读 · 0 评论 -
从QC学数据分析——数据分析方法论
在数据分析的道路上越走越远阴差阳错的做了数据分析,而且一开始我还不知道自己在做的是数据分析,看了很多数据分析的书,也走了一些弯路,做了很多实践项目,突然很想把自己作为一个小白的数据分析之路的成长过程写下来。这个系列写一写从QC里面学到的数据分析的方法。 01 QC-现状调查QC里,现状调查的目的是把握问题现状,找出问题症结,确定改进方向和程度,为目标设定和原因分析提供依据,所以...原创 2018-12-16 20:04:06 · 2064 阅读 · 0 评论 -
用Excel做相关性分析
一、概念理解相关关系:变量之间存在着的非严格的不确定的关系,对它们进行深层次的分析,观察它们的密切程度。相关性分析:对变量之间相关关系的分析,即相关性分析。其中比较常用的是线性相关分析,用来衡量它的指标是线性相关系数,又叫皮尔逊相关系数,通常用r表示,取值范围是[-1,1], r取值范围 相关程度 |r|<0.3 ...原创 2019-01-04 22:51:44 · 77300 阅读 · 1 评论 -
用Excel做排列图
排列图,又叫帕累托图、主次图,是按照发生频率大小顺序绘制的直方图,是QC中不可获取的工具。这里详细介绍一下用Excel做规范的排列图的方法。案例中用的是Excel2016. 比较规范的排列图应该是这样子,也是我们的目标。注意几个点:折线图从0开始;折线图与柱状图的交点;坐标轴; 一、原始数据和准备工作首先,对于一组想要做排列图的数据,要有类别和频数这两个字段,然后是准备工作...原创 2019-01-01 22:48:20 · 4468 阅读 · 1 评论 -
用Excel做直方图(1):随机数发生器
在介绍用Excel做直方图前,先来介绍用Excel生成随机数的功能,在我看来,这两个功能还是很息息相关的,放在一起学习可以更深入的理解统计学里各种分布的概念。 本节知识点: 数据分析工具库:随机数发生器 离散变量和连续变量 均匀分布、二项分布、伯努利分布、泊松分布、正态分布、离散概率分布 Excel 2016 有个数据分析的功能,可以满足数据分析小白们用...原创 2019-01-22 21:17:54 · 7598 阅读 · 0 评论 -
用Excel做回归分析
Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。本文仅作为学习笔记之用,欢迎各位交流指正。本节知识点: Excel数据分析工具库—回归 线性回归和非线性回归 简单线性回归和多重线性回归 逻辑斯蒂回归 一、什么是回归分析(Regression)1、定义确定两种...原创 2019-02-27 22:17:37 · 88451 阅读 · 1 评论 -
用Excel做控制图
一、什么是控制图控制图亦称“质量管理图”、“质量评估图”。根据数理统计原理分析和判断工序是否处于稳定状态所使用的、带有控制界限的一种质量管理图表。控制图常用于QC(质量管理)中,可以用来评估过程是否存在异常,进而进行有效监控和防御。控制图由上限(UCL)、中心线(CL)和下限(LCL)组成, UCL、LCL通常控制界限设定在±3标准差的位置,中心线是所控制的统计量的平均值,点...原创 2019-03-14 22:36:51 · 21783 阅读 · 0 评论 -
用Excel做直方图(2):频率分布直方图
一、什么是直方图1、定义直方图是一种条形图,是以组距为底边、以频数为高度的一系列连接起来的直方型矩形图2、相关概念组数:在统计数据时,把数据按照不同的范围分成几个组,分成的组的个数称为组数。组距:每一组两个端点的差规格上限:Tu规格下限:Tl公差中心:M=3、步骤求出其最大值和最小值。 将数据分成若干组,并做好记号。 计算组距的宽度。用最大...原创 2019-03-23 17:02:54 · 102490 阅读 · 2 评论 -
SQL基础快速入门
Excel是最简单常用的数据分析工具,用Excel已经基本可以完成对数据的整个分析处理过程,但Excel依旧有它的缺点,比如没法进行大量数据的处理。另一方面,一个优秀的数据分析师不应该只会Excel,搜索“数据分析”关键字的岗位,会发现对于数据分析师的要求,Excel只是默认选项而已,SQL,R,Python才是进阶之路。这一个系列,我们一起学习SQL。一、什么是SQLSQL是一种关...原创 2019-04-10 19:17:46 · 716 阅读 · 0 评论 -
《谁说菜鸟不会数据分析——入门篇》读书笔记
读了《谁说菜鸟不会数据分析——入门篇》,做了一些总结如下:一、数据分析那些事儿1、什么是数据分析数据分析指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。2、数据分析分类:有描述性数据分析、探索性数据分析、验证性数据分析3、数据分析作用:用来进行现状分析(如日报、周报等)、原因分析(如专题分析)、预测分析三种情况4、数据分析的...原创 2018-07-15 22:53:28 · 3731 阅读 · 0 评论