机器学习
文章平均质量分 91
Bruce_0712
这个作者很懒,什么都没留下…
展开
-
(EM算法)The EM Algorithm
EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。当x是向量时,如果其hessian矩阵H是半正定的(),那么f是凸函数。如果或者,那么称f是严格凸函数。 Jense...转载 2021-07-27 19:41:49 · 298 阅读 · 0 评论 -
联合概率、边缘概率、条件概率之间的关系&贝叶斯公式
前言有挺长一段时间没有更新博客了,一方面是学校期末考试,后来又看了一些很基础的编程数学思想的东西(《程序员的数学》第一卷),大多数东西都在之前的学习和使用中都有注意到,所以没有什么特别值得更新的。这次看到了卷2《程序员的数学2——概率统计》发现之前在概率论的学习过程中,忽略了一些比较重要的东西,这边就来记录一下,如果有写的不对和写得不好的地方,请各位看官老爷帮忙指出~正文这次主要介绍的是多个随机变量之间的关系,主要涉及联合概率,边缘概率,条件概率这三种关系,还有一个利用他们之间关系导出的非常重要转载 2020-12-10 10:27:15 · 3249 阅读 · 0 评论 -
P问题、NP问题、NP完全问题和NP难问题
在讲P类问题之前先介绍两个个概念:多项式,时间复杂度。(知道这两概念的可以自动跳过这部分)1、多项式:axn-bxn-1+c恩....就是长这个样子的,叫x最高次为n的多项式....咳咳,别嫌我啰嗦。。有些人说不定还真忘了啥是多项式了。。例如第一次看到的鄙人→_→2、时间复杂度我们知道在计算机算法求解问题当中,经常用时间复杂度和空间复杂度来表示一个算法的运行效率。空间复杂度表示一个算法在计算过程当中要占用的内存空间大小,这里暂不讨论。时间复杂度则表示这个算法运行得到想要的解所需的计算工作转载 2020-12-04 10:30:23 · 296 阅读 · 0 评论 -
[机器学习] focal loss:解决样本不平衡的一种通用方案
文章目录 focal loss 提出的场景和针对的问题 focal loss 提出的场景:目标检测 focal loss 针对的问题:类别不平衡 如何处理目标检测下的类别不平衡 如何理解目标检测场景下的样本和类别 two-stage one-stage focal loss的算法 focal loss的思想 focal loss的局限 假设的局限 适用场景的局限转载 2020-11-02 16:51:12 · 1290 阅读 · 2 评论 -
机器学习——PCA降维
参考文章:https://zhuanlan.zhihu.com/p/77151308PCA(Principal Component Analysis) 是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。PCA 的数学推导可以从最大可分型和最大重构性两方面进行,前者的优化条件为划分后方差最大,后者的优化条件为点到划分平面距离最小。由于基于最大重构性的 PCA 其与 LDA(线性判别法)的数学推导有异曲同工之处,所以我只从最大可分性进行证明,而最大重构性将留在介绍 LDA 算转载 2020-10-24 09:34:21 · 1023 阅读 · 0 评论