第14章——生物信息学统计与算法基础
大规模序列数据分析——高效算法(经典的机器学习算法,深度学习算法)
基于生物序列的遗传推断——统计学方法(贝叶斯统计)
1. 贝叶斯统计
1.贝叶斯统计概述
-
两大统计学派——频率学派、贝叶斯学派
1.1 统计推断三种信息
(1)总体信息
(2)样本信息
(3)先验信息
1.2 贝叶斯学派与经典统计学派的区别贝叶斯统计重视先验信息收集,使其数量化,形成先验分布,经典统计则只利用总体信息和样本信息。 1.将未知数看作随机变量问题(即对某一未知数是某一情况的假设设为一个概率值,而非100%) 2.主观概率问题(对于概率值的确定是由先验经验决定的,而非大量重复实验)
1.3 贝叶斯派基本观点
任何一个未知数都可以看做一个随机变量,并应该用一个概率分布去描述该未知数的未知状态。 而且这个未知数的概率分布是在抽样前就有的,是一种**先验分布**
-
贝叶斯公式推断
知识点梳理: 1.概率与期望的区别 概率——只表示某事发生的可能性大小 期望——则是对于某个事件发不发生带来的综合收益或均值