《深入浅出数据分析》读书笔记

1.数据分析基本流程:
确定问题-分解问题-评估-决策
2.对不明显的数据,要进行数据挖掘来发现有用的知识
3.心智模型:大脑利用新信息的工具
4.当怀疑因果走向时,注重反向思考(B影响A)
5.混杂因素:演技对象的个人差异
怎样查清混杂因素:就自己正在研究的问题问自己一些常识性问题,借此想象这些变量是否会影响你的分析结果。
6.控制组(对照组):
一组体现现状的处理对象,未经过任何新的处理。

分析工具:实验设计、最优化、图表、假设检验、贝叶斯规则·
7.最优化问题: c表示约束条件:c1p1+c2p2=P(目标,期待的最大化对象)
8.数据图形化的根本在于正确比较.
散点图:发现因果关系
9.伪证法(排除异质数据):剔除无法证实的假设—>对假设进行评级,不利证据越少的越排在前面。
10.诊断性:能够帮助你评估各种假设的相对强度(存在支持假设和不利假设),证据和数据就具有诊断性。
11.直接概率问题(贝叶斯)

贝叶斯规则:在假设成立或者不成立的条件下看证据出现的几率。

12.启发式:一种解决问题的方法,可能得出正确答案,但不保证得出最优化答案。最优化是最理想的情况。
13.直方图:通过数据子集分析数据
散点图:将不同变量放在一起比较(通常是一个点代表一个对象的不同变量)
使用平均值图预测每个区间内的数值。(显示x轴上的每个区间相对应的Y轴的数值)
14.回归分析:预测未来。算法:不同要求带来的不同结果,决策过程。
相关性为1或者-1都有充足的理由使用回归线
15.误差:外插法:用回归方程预测数据范围以外的数据值
机会误差、残差:实际结果与预测结果之间的偏差

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值