模式识别
文章平均质量分 89
Dmoll
这个作者很懒,什么都没留下…
展开
-
2.1 闲聊贝叶斯公式
贝叶斯公式我过去一直都挺眼熟,P(A∣B)∗P(B)=P(B∣A)∗P(A)P(A|B)*P(B) = P(B|A)*P(A)P(A∣B)∗P(B)=P(B∣A)∗P(A),这么简单的公式到底要怎样利用,我可是一直没弄明白过,以至于每当别人问我贝叶斯公式是什么时,我都不敢说知道。接下来我们就要好好弄清楚贝叶斯公式的应用。现在我们有这样一个问题:已知一批样本,分别属于A和B两个类别,并且两种类别的...原创 2018-10-06 00:38:36 · 310 阅读 · 0 评论 -
学习ROC
首先,我们来了解一下常用的决策分类:在评价一种检测方法的效果是,人们常用到两个概念:灵敏度SnSnSn和特异度SpSpSp。Sn=TPTP+FN,Sp=TNTN+FPSn=\frac{TP}{TP+FN}, Sp=\frac{TN}{TN+FP}Sn=TP+FNTP,Sp=TN+FPTN灵敏度表示真正的阳性样本中有多少比例能被正确检测出来,特异度表示在真正的阴性样本中有多少比例没有...原创 2018-10-06 12:31:55 · 214 阅读 · 0 评论 -
决策树与随机森林
决策树是一种常用于解决分类问题的简单机器学习算法。决策树是由一系列节点组成的,每一个节点代表一个特征和相应的决策规则。决策过程很简单,一个简单的例子如下图所示:1. 如何构建决策树?决策树的构建过程就是选取特征和确定决策规则的过程。那我们该怎样决定首先选择哪个特征进行决策呢?ID3算法最早比较著名的决策树构建方法是ID3。通过选择有辨别力的特征对数据进行划分,直到每个叶节点上只包含单一...原创 2018-10-13 15:31:58 · 3085 阅读 · 0 评论 -
浅尝马尔科夫模型
马尔科夫模型(Markov Model)又是一个我之前经常听到但从未弄明白的模型。下面我们试着来增进对它的理解。本文将讨论在离散情况下使用马尔科夫模型的统计决策方法。贝叶斯决策的基本思想是根据一定的概率模型得到样本属于某类的后验概率,然后根据后验概率的大小进行决策。问题描述:基因组上CpG相对富集的区域被称作CpG岛,接下来我们要从给定的一定DNA序列,判断它是否来自CpG岛,这属于一个两分...原创 2018-10-07 10:38:09 · 2402 阅读 · 0 评论 -
概率密度函数的估计
之前的博客中已经提到,贝叶斯决策的基础是概率密度函数的估计,即根据一定的训练样本来估计统计决策中用到的先验概率P(wi)P(w_i)P(wi)和类条件概率密度p(x∣wi)p(x|w_i)p(x∣wi)。概率密度函数的估计分为参数估计和非参数估计。极大似然估计极大似然估计属于一种典型的参数估计法。在最大似然估计(maximum likelihood estimation)中,我们做以下...原创 2018-10-09 20:33:20 · 6546 阅读 · 1 评论 -
线性判别分析LDA
线性判别分析LDA前言:我在我的第一家公司分析宏基因组数据时,碰到过LDA,不过当时没有去搞明白,今天有机会再来学习它。在这里,我们将了解到线性判别分析是属于一种线性分类器。线性分类器是最简单的分类器。线性判别函数的一般表达式为g(x)=wT+w0g(x)=w^T+w_0g(x)=wT+w0下面我们开始学习最直观的Fisher线性判别分析(linear discriminant anal...原创 2018-10-10 20:37:12 · 990 阅读 · 0 评论 -
几种线性回归方法的简介
在给定一列数据(x1,y1),...,(xn,yn)(x_1, y_1), ...,(x_n, y_n)(x1,y1),...,(xn,yn)时,如果认为它满足线性模型:y=a+bx+ϵy=a + bx + \epsilony=a+bx+ϵ则可以用不同方法估计参数来拟合直线。1. 最小二乘法(OLS)回归最小二乘法是大家平时用的最多的拟合线性模型的方法,它使:RSS(a,b)=∑...原创 2018-12-09 19:11:37 · 12056 阅读 · 0 评论