- 博客(3)
- 收藏
- 关注
原创 《深入浅出数据分析》一书要点记录(三):第10章到第13章
10. 回归——预测 要点: (1)算法:为了完成某个计算而执行的任何过程。 (2)散点图:见第4章,用于显示观察结果的成对关系。 (3)平均值图:一种散点图,显示了与X轴上的每个区间相对应的Y轴数值。 (4)回归线:最准确地贯穿平均值图中各个点的直线,可以用等式来表达,用来预测某个范围内的X变量对应的Y变量。 斜率b的计算如下(其中r是相关系数,σ是标准偏差): (5)相关...
2018-11-14 17:48:49
375
原创 《深入浅出数据分析》一书要点记录(二):第6章到第9章
6. 贝叶斯统计——穿越第一关 要点: (1)区分真阳性、假阳性、真阴性和假阴性。其中假阳性和假阴性均为误诊。 (2)条件概率:以一件事的发生为前提的另一件事的发生概率。计算时,如果有基础概率,必须用上。 (3)贝叶斯规则 案例: 已知蜥蜴流感诊断书,使用贝叶斯规则计算了患蜥蜴流感的条件概率。 数据: 患蜥蜴流感的基础概率,诊断试验结果,正确性统计值 7. 主观概率——信...
2018-11-14 17:12:51
486
1
原创 《深入浅出数据分析》一书要点记录(一):第1章到第5章
学前准备: (1)下载案例涉及的数据文件。 https://resources.oreilly.com/examples/9780596153946/ (2)下载并安装R和RStudio(DeskTop版本),参考附录B。 https://cran.r-project.org/mirrors.html https://www.rstudio.com/products/rstudio/do...
2018-11-14 17:01:02
511
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人