![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
潜心学习的渣渣
这个作者很懒,什么都没留下…
展开
-
机器学习:损失函数、代价函数、正则化
1. 定义转载来自 几种常见的损失函数损失函数(Loss Function)是用来评估模型好坏程度,即预测值f(x)与真实值的不一致程度,通常表示为L(Y, f(x))的一个非负的浮点数。比如你要做一个线性回归,你拟合出来的曲线不会和原始的数据分布是完全吻合(完全吻合的话,很可能会出现过拟合的情况),这个差距就是用损失函数来衡量。那么损失函数的值越小,模型的鲁棒性也就越好,对新数据的预测能力也就越强损失函数(Loss Function) :直接作用于单个样本,用来表达样本的误差风险函数(R原创 2020-08-08 13:58:05 · 928 阅读 · 0 评论 -
深度学习:论文解读以及有关神经系统和符号系统
前言侵删。如果有不对,欢迎提出来!话不多说,先膜拜参考文献的作者们。导师:读论文不仅要读懂这篇论文的内容,还要深挖其内在:为什么作者选择这样的方式我:嗯嗯嗯嗯好好好【不是很了解,所以我来记录一下,渣渣本渣】论文Neural Collaborative Reasoning 于2020年5月发表,属于推荐系统方向摘要现状;协同过滤(CF)一直是推荐系统的重要途径。然而,现有的CF方法大多是基于匹配的思想来设计的,即通过使用浅层或深层模型从数据中学习用户和项目嵌入, 它们试图寻找数据中的关联,以原创 2020-07-07 23:15:19 · 1564 阅读 · 0 评论 -
拉普拉斯平滑(Laplacian smoothing)
概念零概率问题:在计算事件的概率时,如果某个事件在观察样本库(训练集)中没有出现过,会导致该事件的概率结果是0。这是不合理的,不能因为一个事件没有观察到,就被认为该事件一定不可能发生(即该事件的概率为0)。拉普拉斯平滑(Laplacian smoothing) 是为了解决零概率的问题。法国数学家 拉普拉斯 最早提出用 加1 的方法,估计没有出现过的现象的概率。理论假设:假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题具体公式总结:分子加一原创 2020-06-07 16:16:46 · 22281 阅读 · 0 评论 -
隐马尔可夫模型(四)学习问题
学习问题已知观测序列O,估计模型λ的参数,使得在该模型下观测序列概率P(O|λ)最大。解决算法最大似然估计(有监督)有监督意味着在给定的训练集中观测序列O={o1,o2,…,oT}和隐状态序列I={i1,i2,…,iT}算法流程如下:转移概率aij的估计设样本中时刻 t 处于状态 i 时刻 t+1 转移到状态j的次数为 Aij,从状态转移到状态的概率aij的估计是: 其中,分母表示从状态 i 转移到任意状态的次数。观测概率bj(k)的估计:设样本中状态为 j 并观测为 k 的频数原创 2020-05-31 16:46:48 · 1169 阅读 · 0 评论 -
隐马尔可夫模型(三)预测问题
概率计算问题已知模型λ和观测序列O,求对给定观测序列条件概率P(I|O)最大的状态序列。即给定观测序列,求最有可能的对应的状态序列。解决算法近似算法近似算法的核心思想是在每个时刻t选择在该时刻最有可能出现的状态 it*,从而得到一个近似状态序列。具体算法流程如下:给定隐马尔可夫模型λ和观测序列O,在时刻t处于状态qi的概率为:(详见向前向后算法)在每一时刻t最有可能的状态 it* 是:从而得到状态序列 I*:这种算法的优点是算法简单易理解。缺点是预测的序列可能有实际不发生的部分,原创 2020-05-27 01:15:04 · 1590 阅读 · 0 评论 -
隐马尔可夫模型(二)概率计算问题
概率计算问题给定模型λ和观测序列O,计算在模型λ下观测序列O出现的慨率P(O|λ)。具体问题描述假设已知模型 λ :状态集合 S:健康,发烧;可观测集合 O:正常、冷、头晕;初始概率的状态矩阵 π:转移矩阵 A:观测状态转移概率矩阵(发射矩阵)B:已知:观测序列 O :正常,冷,头晕问:在该模型 λ 下,观测序列 O出现的概率。遍历法在知道模型参数和观测序列的情况下,我们只需要列出所有可能的状态序列,然后求每个状态序列下的得到观察序列O的概率,再将这些概率相加起来就是我们最终原创 2020-05-26 15:19:06 · 1999 阅读 · 2 评论 -
隐马尔可夫模型(一)概念
隐马尔可夫模型(HMM)很多机器学习模型都有一个共同的假设:数据与数据之间是相互独立的,模型只关注当前数据的自变量与因变量之间的关系。但是在现实生活中,我会发现数据间的顺序对数据产生是有影响的。在学术上,具有这种特性的数据被称为序列数据(sequential data)。隐马尔可夫模型(HMM) 则可以很好地观测这类数据,它是关于时序的概率模型,用有向图表示。应用场景:在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中的成功应用,使它成为一种通原创 2020-05-21 00:16:23 · 522 阅读 · 0 评论