笔记《深入浅出的数据分析》下

8启发法——凭人类的天性做分析

调查方法要有可行性,这就包含了成本预算。明确目的性。条条大路通罗马,太贵的路走不起,太绕的路没时间,权衡分析寻找可行路径。
启发法:
1心理学定义,用一种更便于理解的属性代替一种难解的、令人困惑的属性。
2计算机科学定义,一种解决问题的方法,可能会得出正确答案,但不保证得出最优化答案。

描述起发发的图形——快省树
快:完成这个过程费时不多
省:不需要大量的认知资源

这里写图片描述
这里写图片描述
这里写图片描述这里写图片描述这里写图片描述


9数字的形状

这一张主要讲了R软件,个人感觉初级可以用一些别的数据图形化软件代替。R软件要用R语言,请单独学习相关的书籍资料。excel做条形图会出现一些问题比如条形之间有空缺等。如果你有比较好的数据图形化软件请留言!!!!!!!!!!!!!!!!!
一组数据,可以拆分成多种组合来画图,但首先要明确目的和手段。不要把手段当成目的,画一堆没用的图。
这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述


10回归

你以为上一章就结束了?充分利用数据了?
那你就大错特错了!上一章只是告诉你你该去提出加薪,而已!!
那究竟该提出加薪多少呢?提出多少和得到多少之间是什么关系呢?
这里写图片描述
用散点图比较两种变量
回归线预测出人们的实际加薪幅:
就是他——迷人的回归线
回归线就是最准确地贯穿平均值图中的各个点的直线。
回归线可以用简单的等式表达,通过该等是可以预测摸个范围内的X变量对应的Y变量。

11误差——合理误差

外插法:用回归方程预测数据范围以外的数值成为外插法。小心外插法!!
这里写图片描述这里写图片描述
机会误差=实际结果于模型预测结果之间的偏差
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述这里写图片描述


12关系数据库

要有目的性,找出多个数据库中需要的部分,学会excel,mysql,善用


13整理数据

善于分解数据,学会excel拆分
find ————告诉你单元格的哪个位置查找搜索字符串
lef t ————取单元格左边字符串
right ————取右边
trim ————删除单元格中的空格
len ————求长度
concatenate ————去两个值合并
value ————文本格式存数值
substitute ————以指定的新文本替代单元格中不需要的文本

数据查重,唯一性关键词排序,方便查重。
创建美观、整洁、具有唯一性的记录

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值