独家 | 一文读懂最大似然估计(附R代码)

640?wx_fmt=png

作者:阿尼·辛格

翻译: 陈之炎

校对:丁楠雅

本文约4200字,建议阅读10+分钟

本文将研究MLE是如何工作的,以及它如何用于确定具有任何分布的模型的系数。


简介


解释模型如何工作是数据科学中最为基本最为关键的问题之一。当你建立了一个模型之后,它给了你预期的结果,但是它背后的过程是什么呢?作为一个数据科学家,你需要对这个经常被问到的问题做出解答。

 

例如,假设您建立了一个预测公司股价的模型。您注意到夜深人静的时候,股票价格上涨得很快。背后可能有多种原因,找出可能性最大的原因便是最大似然估计的意义所在。这一概念常被用于经济学、MRIs、卫星成像等领域。

 

640?wx_fmt=png

来源:YouTube


在这篇文章中,我们将研究最大似然估计(以下简称MLE)是如何工作的,以及它如何用于确定具有任何分布的模型的系数。理解MLE将涉及到概率和数学,但我将尝试通过例子使它更通俗易懂。


注:如前所述,本文假设您已经了解概率论的基本知识。您可以通过阅读这篇文章来澄清一些基本概念:


《每个数据科学专业人员都应该知道的概率分布常识》

https://www.analyticsvidhya.com/blog/2017/09/6-probability-distributions-data-science/


目录


  • 为什么要使用最大似然估计(MLE)?

  • 通过一个实例了解MLE

  • 进一步了解技术细节

    • 分布参数

    • 似然

    • 对数似然

    • 最大似然估计

  • 利用MLE确定模型系数

  • R语言的MLE实现


为什么要使用最大似然估计(MLE)?


假设我们想预测活动门票的销售情况。数据的直方图和密度如下。

 

640?wx_fmt=jpeg


你将如何为这个变量建模?该变量不是正态分布的,而且是不对称的,因此不符合线性回归的假设。一种常用的方法是对变量进行对数、平方根(sqrt)、倒数等转换,使转换后的变量服从正态分布,并进行线性回归建模。


让我们试试这些转换,看看结果如何:


  • 对数转换:

 

640?wx_fmt=jpeg


  • 平方根转换:

 

640?wx_fmt=jpeg


  • 倒数转换:

 

640?wx_fmt=jpeg


所有这些都不接近正态分布,那么我们应该如何对这些数据进行建模,才能不违背模型的基本假设?如何利用正态分布以外的其他分布来建模这些数据呢?如果我们使用了不同的分布,又将如何来估计系数?


这便是最大似然估计(MLE)的主要优势。


举一个例子来加深对MLE的理解

  • 12
    点赞
  • 75
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值