机器学习-----数学 ----最大似然估计

最大似然估计

最大似然估计是机器学习中比较重要的概率统计问题,这里将介绍比较重要几个和易混淆的问题:

1.首先确定采样是独立同分布的(i.i.d.)。
2. 在这里先假设,样本分布符合高斯分布。

独立性:

P ( A B ) = P ( A ) ⋅ P ( B ) \mathbb P (AB)=\mathbb P (A) \cdot \mathbb P (B) P(AB)=P(A)P(B)

同分布:

保证了所有的样本点符合同一分布,这里假设为高斯分布,连续性分布,即 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2)注: 非连续性分布,过程类似。

样本

假设抽样了 X 1 , X 2 , X 3 . . . . , X 1 = { x 1 , x 2 , . . . x n } X_1,X_2,X_3....,X_1=\{x_1,x_2,...x_n\} X1,X2,X3....,X1={x1,x2,...xn},所以 f ( x 1 ; μ , σ ) = 1 2 π σ 2 e − 1 2 σ 2 ( x 1 − μ ) 2 , P ( x 1 ; μ , σ ) = 1 2 π σ 2 e − 1 2 σ 2 ( x 1 − μ ) 2 d x 1 P ( X ; μ , σ ) = ∏ i = 1 n P ( x i ; μ , σ ) = ∏ i = 1 n f ( x 1 ; μ , σ ) d x i = ∏ i = 1 n 1 2 π σ 2 e − 1 2 σ 2 ( x i − μ ) 2 ⋅ ∏ i = 1 n d x i \Large f(x_1;\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2}(x_1-\mu)^2},\\P(x_1;\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2}(x_1-\mu)^2} dx_1 \\ \Large P(X;\mu,\sigma)= \prod_{i=1}^{n}P(x_i;\mu,\sigma) =\prod_{i=1}^{n}f(x_1;\mu,\sigma) dx_i\\ =\prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2} (x_i-\mu)^2} \cdot \prod_{i=1}^{n}dx_i f(x1;μ,σ)=2πσ2 1e2σ21(x1μ)2,P(x1;μ,σ)=2πσ2 1e2σ21(x1μ)2dx1P(X;μ,σ)=i=1nP(xi;μ,σ)=i=1nf(x1;μ,σ)dxi=i=1n2πσ2 1e2σ21(xiμ)2i=1ndxi

\
\

似然函数(Likelihood function,似乎是这样的函数)

\
由独立性和同分布性可得,这里我们用 L m L_m Lm表示联合概率密度分布,因为 ∏ i = 1 n d x i \prod_{i=1}^{n}dx_i i=1ndxi为定值与 μ , σ \mu,\sigma μ,σ无关这里说明了在最大似然估计中为啥不是概率分布,而是概率密度函数

L m ( μ , σ ; X 1 ) = ∏ i = 1 n f ( x 1 ; μ , σ ) = ∏ i = 1 n 1 2 π σ 2 e − 1 2 σ 2 ( x i − μ ) 2 \Large L_m(\mu,\sigma;X_1) = \prod_{i=1}^{n}f(x_1;\mu,\sigma) =\prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2} (x_i-\mu)^2} Lm(μ,σ;X1)=i=1nf(x1;μ,σ)=i=1n2πσ2 1e2σ21(xiμ)2

由于连乘形式不好运算,所以我们两边同时取对数得,用$ l_m$ 取对数后的概率密度分布:

l m ( μ , σ ; X 1 ) = ∑ i = 1 n l n f ( x 1 ; μ , σ ) = − n 2 l n ( 2 π σ 2 ) − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 \Large l_m(\mu,\sigma;X_1) = \sum_{i=1}^{n}lnf(x_1;\mu,\sigma) = -\frac{n}{2}ln(2\pi\sigma^2)-\frac{1}{2\sigma^2} \sum_{i=1}^{n}(x_i-\mu)^2 lm(μ,σ;X1)=i=1nlnf(x1;μ,σ)=2nln(2πσ2)2σ21i=1n(xiμ)2

最大似然估计(MLE)

这里我们取 θ = ( μ , σ ) \theta = (\mu,\sigma) θ=(μ,σ),我们要得到使得似然函数 L m L_m Lm取得最大值的 、 θ \theta θ 的参数估计,即: θ ^ \widehat \theta θ ,称为参数 θ \theta θ的最大似然估计。
所以对上述似然方程求偏导得,尖帽表示估计值:
∂ l ∂ σ = ∂ l ∂ μ = 0 μ ^ = 1 n ∑ i = 1 n x i σ ^ = 1 n ∑ i = 1 n ( x i − μ ^ ) 2 \Large \frac{\partial{l}}{\partial\sigma}=\frac{\partial{l}}{\partial\mu} =0\\ \Large \widehat\mu =\frac{1}{n}\sum_{i=1}^{n}x_i\\ \Large \widehat\sigma = \frac{1}{n}\sum_{i=1}^{n}(x_i-\widehat\mu)^2\\ σl=μl=0μ =n1i=1nxiσ =n1i=1n(xiμ )2

所以可得参数 θ \theta θ的最大似然估计值为 ( μ ^ , σ ^ ) (\widehat\mu,\widehat\sigma) (μ ,σ )
参数的 θ \theta θ最大估计量:

μ ^ = X ˉ σ ^ = 1 n ∑ i = 1 n ( x i − X ˉ ) 2 \Large \widehat\mu =\bar X\\ \Large \widehat\sigma = \frac{1}{n}\sum_{i=1}^{n}(x_i-\bar X)^2\\ μ =Xˉσ =n1i=1n(xiXˉ)2

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 机器学习数学(李明pdf)是一本介绍机器学习数学基础的教材。这本书主要分为两个部分:数学基础和机器学习算法。在数学基础部分,作者通过讲解线性代数、概率论和统计学等数学概念,为读者建立起机器学习数学基础。这些数学概念对于理解机器学习算法以及其背后的原理至关重要。在机器学习算法部分,作者详细介绍了一些常见的机器学习算法,如线性回归、逻辑回归、朴素贝叶斯、决策树等,并结合数学原理解释了这些算法是如何工作的。 这本书的优点在于将复杂的数学理论与机器学习算法相结合,通过具体的例子和推导过程,将抽象的数学概念转化为实际问题的解决方案。这种融合的方式,使得读者能够更加深入地理解机器学习的本质,并能够灵活运用数学知识解决实际问题。 然而,这本书也存在一些不足之处。首先,由于篇幅有限,对于某些复杂的数学概念和机器学习算法,有时只是进行了简单的介绍,没有深入探讨。其次,这本书的数学推导过程较为繁琐,需要读者有一定的数学基础才能够理解。 总的来说,机器学习数学(李明pdf)是一本介绍机器学习数学基础的教材,通过将数学理论与机器学习算法相结合,帮助读者建立数学基础,并理解机器学习算法的原理和应用。尽管存在一些不足之处,但这本书对于想要深入研究机器学习的读者来说,是一本很好的参考书籍。 ### 回答2: 《机器学习数学:理论、算法与应用》是雷明博士所著的一本介绍机器学习数学关系的重要著作。该书主要涵盖了机器学习数学基础、主要理论和常用算法,并提供了丰富的实例和应用案例。 在《机器学习数学:理论、算法与应用》这本书中,雷明详细介绍了机器学习所涉及到的数学概念和方法,包括线性代数、概率论与统计学、数值计算等。书中提到了机器学习的核心概念,例如特征向量、数据正则化、最小二乘法等,并且解释了这些概念在机器学习中的应用。 该书还涵盖了机器学习的主要理论,包括监督学习、无监督学习和强化学习等。雷明通过数学模型和公式详细地解释了这些理论的原理和算法,并引用了大量的实际案例来说明机器学习在现实中的应用。对于读者来说,这本书将帮助他们理解机器学习的基本原理和方法,并且能够运用这些知识解决实际问题。 总之,雷明的《机器学习数学:理论、算法与应用》是一本介绍机器学习数学关系的重要著作。通过本书,读者可以深入理解机器学习中所涉及的数学概念和方法,并将其运用到实际问题中。这本书对于研究和应用机器学习的学者和工程师来说,是一本不可或缺的参考资料。 ### 回答3: 《机器学习数学 雷明pdf》 是由雷明编写的一本介绍机器学习数学原理和方法的电子书。机器学习是一门涉及统计学、概率论和优化方法等多个数学领域的交叉学科,并且数学机器学习的重要基础。 这本书首先介绍了机器学习的基本概念和应用领域,并重点讲解了机器学习数学基础。这些基础包括线性代数、概率论、统计学、优化方法等。线性代数用于理解机器学习中的向量和矩阵运算,是许多重要机器学习算法的基础。概率论和统计学则是理解机器学习中的概率模型和统计推断的基础,包括贝叶斯方法、最大似然估计等。优化方法是机器学习中用于求解最优化问题的数学方法,比如梯度下降、牛顿法等。 《机器学习数学 雷明pdf》不仅提供了丰富的数学理论知识,还通过案例和实例呈现了数学机器学习中的应用。读者可以通过这本书系统地学习和理解机器学习中涉及的数学原理,并通过实践应用到实际问题中。 总之,《机器学习数学 雷明pdf》是一本深入浅出地介绍机器学习数学基础的电子书。通过学习这本书,读者可以更好地理解和应用机器学习算法,并在实际问题中做出更准确和可靠的预测和决策。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值