贝叶斯数据分析_周末说说数据分析(2)

这是一份关于《深入浅出数据分析》的读书笔记。比较枯燥,不过我尽量说得简单,感兴趣就看看。

上个周我们聊到了这本书讲到的一到三章,第一章呢是讲数据分析的一些理念,聊到数据分析开始前要了解数据背后的故事,了解数据提供者的心智模型(说白了也就是数据管理者关于数据的看法),然后才开始分析数据;第二章讲到了企业经营者或者其他人员可能对我们的分析产生干扰,企业经营者也可能对我们的分析结果进行质疑。我们要做的是,找出经营者与数据分析结果冲突的地方,从而进行解释。如果无法解释冲突点,就要合理怀疑我们根据数据分析出的结论;第三章讲了在若干约束条件情况下的最优解。

周末说说数据分析(1)

本周我们继续来聊聊这本书第四到六章。
第四章讲数据图形化和数据关系探索,里面主要讲关于大量多维数据可视化,以及寻求数据间的因果关系。书中提供了一种叫做散点图的工具用于探索二维到多维数据因果关系。关于散点图的使用,这里只需要看这个图就可以了(下图为一个描述电商系统各项运营指标和营收之间关系的散点图)

9d94537cb96670457e1e4cc196d2c334.png

第五章讲假设检验,这章其实很简单。就是要让我们对假设证伪,而不是依据直觉。其实我想起名侦探柯南里面一句经典台词:排除所有不可能,剩下的结论无论多么不合理,都是答案。而对于无法证伪的假设,要看相关证据对假设的支持力度。选择证据支持最强的假设,同时要动态加入新的证据。
个人感觉这一章其实并不是在讲数据分析,但是在说推理,感兴趣可以看看原书。

第六章是说贝叶斯统计,就是根据一项针对某疾病的测试结果和一些统计数据,估计你得这项疾病的几率,关于贝叶斯统计和传统频率统计感觉特别烧脑。主要就是这两个东东:

1) 条件概率P(a|b):指在b事件发生时,发生a事件的概率,原书中用P(L|+)表示在已经测试为阳性的情况下,患蜥蜴流感的概率。

2)贝叶斯概率公式:P(L|+)=P(L)*P(+|L)/(P(L)*P(+|L)+P(~L)*P(+|~L)),其中P(L)+P(~L)=1, 为基础概率,新的信息会改变基础概率,此时应该用新的基础概率导入重新计算。第七章貌似也是讲贝叶斯统计,我再琢磨琢磨,下周再更。这次前两章还好,第六章对学渣来说确实太不友好了。

其实看到这里,这本书一些理念我其实非常赞同,但是就目前来说,有些实操,个人感觉最优解问题和散点图似乎都可以用于财务预测,但是贝叶斯统计暂时没想到应用场景。

本文仅作记录,下周见。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值