![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 91
Dmoll
这个作者很懒,什么都没留下…
展开
-
学习笔记-支持向量机(SVM)
Support Vector Machines支持向量机也是一种用于解决分类任务的算法;从逻辑回归到支持向量机在逻辑回归算法里,如果一个样本的目标分类为1时,我们希望h(θ)≈1h(θ)\approx1,并且θTx>>0θ^Tx\gt\gt0; 但对于SVM,我们的要求更严厉,即当一个样本的目标分类为1时,我们希望h(θ)≈1h(θ)\approx1,并且θTx>>1θ^Tx\gt\gt1;同样的原创 2017-08-20 13:21:52 · 526 阅读 · 0 评论 -
概率密度函数的估计
之前的博客中已经提到,贝叶斯决策的基础是概率密度函数的估计,即根据一定的训练样本来估计统计决策中用到的先验概率P(wi)P(w_i)P(wi)和类条件概率密度p(x∣wi)p(x|w_i)p(x∣wi)。概率密度函数的估计分为参数估计和非参数估计。极大似然估计极大似然估计属于一种典型的参数估计法。在最大似然估计(maximum likelihood estimation)中,我们做以下...原创 2018-10-09 20:33:20 · 6562 阅读 · 1 评论 -
浅尝马尔科夫模型
马尔科夫模型(Markov Model)又是一个我之前经常听到但从未弄明白的模型。下面我们试着来增进对它的理解。本文将讨论在离散情况下使用马尔科夫模型的统计决策方法。贝叶斯决策的基本思想是根据一定的概率模型得到样本属于某类的后验概率,然后根据后验概率的大小进行决策。问题描述:基因组上CpG相对富集的区域被称作CpG岛,接下来我们要从给定的一定DNA序列,判断它是否来自CpG岛,这属于一个两分...原创 2018-10-07 10:38:09 · 2411 阅读 · 0 评论 -
决策树与随机森林
决策树是一种常用于解决分类问题的简单机器学习算法。决策树是由一系列节点组成的,每一个节点代表一个特征和相应的决策规则。决策过程很简单,一个简单的例子如下图所示:1. 如何构建决策树?决策树的构建过程就是选取特征和确定决策规则的过程。那我们该怎样决定首先选择哪个特征进行决策呢?ID3算法最早比较著名的决策树构建方法是ID3。通过选择有辨别力的特征对数据进行划分,直到每个叶节点上只包含单一...原创 2018-10-13 15:31:58 · 3103 阅读 · 0 评论 -
学习ROC
首先,我们来了解一下常用的决策分类:在评价一种检测方法的效果是,人们常用到两个概念:灵敏度SnSnSn和特异度SpSpSp。Sn=TPTP+FN,Sp=TNTN+FPSn=\frac{TP}{TP+FN}, Sp=\frac{TN}{TN+FP}Sn=TP+FNTP,Sp=TN+FPTN灵敏度表示真正的阳性样本中有多少比例能被正确检测出来,特异度表示在真正的阴性样本中有多少比例没有...原创 2018-10-06 12:31:55 · 223 阅读 · 0 评论 -
2.1 闲聊贝叶斯公式
贝叶斯公式我过去一直都挺眼熟,P(A∣B)∗P(B)=P(B∣A)∗P(A)P(A|B)*P(B) = P(B|A)*P(A)P(A∣B)∗P(B)=P(B∣A)∗P(A),这么简单的公式到底要怎样利用,我可是一直没弄明白过,以至于每当别人问我贝叶斯公式是什么时,我都不敢说知道。接下来我们就要好好弄清楚贝叶斯公式的应用。现在我们有这样一个问题:已知一批样本,分别属于A和B两个类别,并且两种类别的...原创 2018-10-06 00:38:36 · 317 阅读 · 0 评论 -
Sequence Models-第一周
前沿距离上次在Coursera平台上课已经有几个月了,当时本以为自己会用不到RNN的东西,所以就没有继续学下去。然而最近参加了一些面试,发现掌握RNN还是非常有必要的,序列模型在生活中的应用还是挺广的,在金融量化投资领域尤其重要,所以趁着最近有点迷茫,又决定好好学一学RNN,达到至少懂一些的程度。1.1 为什么选择序列模型序列模型在生活中的应用非常广泛: 1.2 Nota...原创 2018-07-29 18:00:42 · 469 阅读 · 0 评论 -
CNN-第四周
1. 人脸识别Face recognition可分为:Verification, Recognition。 1.1 One Shot LearningOne shot learning所针对的情况是,在训练集只有一张目标对象的图片时,正确识别目标对象。 显然基于我们之前的知识,在只有目标对象的一个训练样本时,无法构建出一个有效的深度学习模型。因此我们相信构建一个能够学习分辨两个样本相似度的模原创 2018-03-21 20:24:30 · 172 阅读 · 0 评论 -
学习笔记—Optimization algorithms
这是这门课程第二周的内容。 当深度学习遇到大数据(样本量在十万级以上)时,我们之前的常规操作在这时可能会变得很笨重。1. Mini-batch gradient descent之前在模型训练过程时,每一轮迭代都需要遍历整个训练集样本,当样本集非常大时,这样的每一轮都将经历漫长的时间。为了应对这一难题,有人提出了Mini-batch gradient descent,与之对应的是batch grad原创 2017-11-16 21:53:06 · 386 阅读 · 0 评论 -
线性判别分析LDA
线性判别分析LDA前言:我在我的第一家公司分析宏基因组数据时,碰到过LDA,不过当时没有去搞明白,今天有机会再来学习它。在这里,我们将了解到线性判别分析是属于一种线性分类器。线性分类器是最简单的分类器。线性判别函数的一般表达式为g(x)=wT+w0g(x)=w^T+w_0g(x)=wT+w0下面我们开始学习最直观的Fisher线性判别分析(linear discriminant anal...原创 2018-10-10 20:37:12 · 1001 阅读 · 0 评论