《深入浅出数据分析》
《深入浅出数据分析》
Tobesix
这个作者很懒,什么都没留下…
展开
-
《深入浅出数据分析》-13.整理数据
十三、整理数据Head First猎头公司是你的最新主顾,该公司从一家停业的竞争对手哪里搞到一份求职人员名单,需要我们帮忙处理数据,他们需要的是一份电话号码清单,这样他们的销售团队就能给不认识的候选人打电话。①通过Excel的分隔符就可以将数据分为多个列②用SUBSTITUTE(单元格,“要替换字符”,“新字符”)-->去除FirstName中的^③或者使用正则表...原创 2020-04-19 15:55:41 · 486 阅读 · 0 评论 -
《深入浅出数据分析》-12.关系数据库
十二、关系数据库《数据邦新闻》是时下盛行的一份新闻类杂志,他们想把每期杂志的文章数目与销量关联起来,然后找出在每一期刊物上刊登文章的最优数量。他们希望每一期的杂志都能尽量经济有效,要是每期杂志刊登一百篇文章比刊登五十篇文章带来的销量并无提高,那他们就不刊登那么多;另一方面,要是刊登五十篇文章比刊登十篇文章能带来更大销量,那他们就会刊登五十篇文章。通过销量表-->期刊表--&g...原创 2020-04-19 15:11:31 · 206 阅读 · 0 评论 -
《深入浅出数据分析》-11.误差(合理误差)
十一、误差下面是几位不同客户的预测结果:内插法:数据范围以内的情况,但偏离回归线外插法:数据范围以外的情况,因为缺少数据无法进行预测,可以提前增加注释“预测范围介于x%至y%之间有效”以下几种情况都会对模型的有效性造成影响但在预测范围内,预测结果也会出现机会误差(实际结果与模型预测结果之间的偏差)我们用均方根误差定量表示残差分布均方根误差:summa...原创 2020-04-16 20:52:10 · 853 阅读 · 0 评论 -
《深入浅出数据分析》-10.回归(预测)
十、回归前面的第九章,我们通过直方图得到了一个结论,主动申请加薪比不主动申请能得到更高的加薪比例,显然,你发现了如何得到更高加薪的秘密,这是大家的福音,所以你也应该利用这个技能来帮别人争取加薪,但要求加多少钱合理呢?从已有的数据中,我们统计了客户的要求加薪幅度与实际加薪幅度在R中运行一下几行指令:加载数据:employees<-read.csv("http://w...原创 2020-04-16 17:38:39 · 380 阅读 · 0 评论 -
《深入浅出数据分析》-9.直方图
九、直方图员工年度考评即将来临,如何才能让老板主动给我们加薪呢?由于你潜心研究星巴仕数据,因此得到了人力资源部过去三年的加薪记录。我们使用R来进行直方图制作,分析流程:直方图:显示出数据点在数值范围内的分布情况下载数据:source("http://www.headfirstlabs.com/books/hfda/hfda.R")画直方图:hist(employee...原创 2020-04-14 22:55:41 · 680 阅读 · 2 评论 -
《深入浅出数据分析》-8.启发法
八、启发法邋遢集是由数据堡市市政府资助的一个非盈利团体,他们进行公共宣传,劝说人们不要乱扔垃圾。他们刚刚把最近的工作结果汇报给了市政府,结果出乎意料。如果你们不拿出各方法减少散乱垃圾量,市政府就会在一个月内消减资金。邋遢集的效果是显著的,但它需要我们使用计量的方法完成任务。我们该从哪里获得散乱垃圾的减少数量呢?下面是邋遢集进行的问卷调查结果,但会议对此报告的感受不深,需要具...原创 2020-04-13 20:59:03 · 340 阅读 · 4 评论 -
《深入浅出数据分析》-7.主观概率
七、主观概率背水公司是一家商号,依靠在发展中市场谋求模糊投资赚钱。他们选择的投资别人很难理解,甚至很难发现。但背水公司的分析师在很多地缘政治趋势方面分歧严重,着给打算根据他们的分析进行投资的投资人带来了极大的问题;导致分歧的问题五花八门。上面出现的概率用词有:可能、极不可能、可能性更大、有可能、可能不、不可能、可能会、肯定、大有机会。下面提到一个概念:主观概率,用一个数字形式的概率...原创 2020-04-13 19:38:04 · 332 阅读 · 0 评论 -
《深入浅出数据分析》-6.贝叶斯统计
六、贝叶斯统计医生给了你一份蜥蜴流感诊断书,好消息是蜥蜴流感并不致命,在家治疗几个星期即可痊愈;坏消息是蜥蜴流感极其麻烦,你需要在家隔离六周以上。上图中情形二计算错误,应该等于8人。上图中最后一行的阴性应该改为阳性。最后证明当被诊断为阳性时,患病的概率仅为9%这时候,又进行了一次高级的诊断试验,概率值出现了变化,并且你的测试结果变成了阴性下图...原创 2020-04-11 22:33:00 · 451 阅读 · 0 评论 -
《深入浅出数据分析》-5.假设检验
五、假设检验欢迎你来到"电肤"公司,这是一家收集"皮肤"制造商,你的任务是弄清楚手机巨头PodPhone下个月是否要出一款新手机,诸多商机悬而未决。要是不备妥手机皮肤迎接产品发布,竞争对手将抢先下手占领市场;要是电肤生产了手机皮肤而PodPhone却不发布产品,投在手机皮肤上的钱就会打水漂。PodPhone总是出人意料地发布产品,因此电肤必须搞清楚发布时间。如果电肤能在PodPhone...原创 2020-04-11 20:48:35 · 419 阅读 · 0 评论 -
《深入浅出数据分析》-4.数据图形化
四、数据图形化新军队是一家在线服装零售商,刚刚进行过一次测试网页外观的实验,在一个月的时间里,每一位浏览网站的人都随机浏览到下列三种主页设计之一。新军队的数据很多,需要我们通过这些海量的数据来画图并展示。数据图像化的根本在于正确比较!客户想知道的是哪一种或者哪一些风格页能够给网站带来最高营业额、最多浏览时间以及最高回访率。下面是相关数据:相比于前一位数据分析师所做的数据报表...原创 2020-04-10 15:28:32 · 608 阅读 · 0 评论 -
《深入浅出数据分析》-3.最优化(寻找最大值)
三、最优化(寻找最大值)你受雇于浴盆宝公式,这家公式执全国橡皮鸭和橡皮鱼玩具生产之牛耳,浴盆玩具是一项正正经经的业务,利润丰厚。他们想尽量提高利润,需要你帮忙找出理想的产品组合:这两种产品我们各应该生产多少?我们对需要的数据进行了整合:商家对我们的问题进行了回复:上面有一个地方要解释一下,商家一个月最多生产量是400只橡皮鸭和300条橡皮鱼,橡皮鸭的数量不会超过400只...原创 2020-04-09 22:36:35 · 946 阅读 · 1 评论 -
《深入浅出数据分析》-2.实验(检验你的理论)
二、实验(检验你的理论)星巴仕咖啡遇到了销量下滑问题,需要制定一个方案恢复元气好的起点是:1.会见首席执行官,弄清楚星巴仕如何进行商务运营的2.进行一次客户调查,弄清楚客户的想法我们通过随机抽取一些典型的咖啡消费者作为样本,问了消费者一堆相关的问题,问卷内容如下:"星巴仕咖啡店的选址对我很方便""端上来的咖啡总是冷热适合""星巴仕员工彬彬有礼,咖啡上的很快"...原创 2020-04-09 11:31:23 · 404 阅读 · 0 评论 -
《深入浅出数据分析》-1.数据分析引言
目录:1 数据分析引言:分解数据数据分析的流程:确定问题阶段分解问题和数据阶段评估阶段决策阶段数据分析报告外界信息数据重新分析工作回顾1 数据分析引言:分解数据Acme公司旗舰产品-保湿露的销售情况:大方向上的问题:过去的六个月销量有什么变化?这六个月的实际总销量与目标总销量相比如何?看出Acme公司的开支规律了吗?你觉得...原创 2020-04-08 12:12:27 · 645 阅读 · 0 评论