bic准则 python实现_模型选择方法：AIC和BIC

最新推荐文章于 2024-07-06 03:18:08 发布

weixin_39548787

最新推荐文章于 2024-07-06 03:18:08 发布

阅读量1.8k

点赞数

文章标签： bic准则 python实现

本文介绍了模型选择的方法，如AIC（赤池信息量）和BIC（贝叶斯信息量）准则。AIC通过平衡模型的复杂性和拟合度来选择模型，而BIC在AIC的基础上考虑了样本数量，防止过拟合。通过Python实现这些准则，以帮助确定最佳模型。

摘要由CSDN通过智能技术生成

推荐看一下参考文献【4】

引入【3】

经常地，对一堆数据进行建模的时候，特别是分类和回归模型，我们有很多的变量可供使用，选择不同的变量组合可以得到不同的模型，例如我们有5个变量，2的5次方，我们将有32个变量组合，可以训练出32个模型。但是哪个模型更加的好呢？目前常用有如下方法：

AIC=-2 ln(L) + 2 k 中文名字：赤池信息量 akaike information criterion

BIC=-2 ln(L) + ln(n)*k 中文名字：贝叶斯信息量 bayesian information criterion

HQ=-2 ln(L) + ln(ln(n))*k hannan-quinn criterion

L是在该模型下的最大似然，n是数据数量，k是模型的变量个数

三个模型A, B, C，在通过这些规则计算后，我们知道B模型是三个模型中最好的，但是不能保证B这个模型就能够很好地刻画数据，因为很有可能这三个模型都是非常糟糕的，B只是烂苹果中的相对好的苹果而已。

这些规则理论上是比较漂亮的，但是实际在模型选择中应用起来还是有些困难的，我们不可能对所有这些模型进行一一验证AIC, BIC，HQ规则来选择模型，工作量太大。

AIC

赤池信息量准则，即Akaike information criterion、简称AIC，是衡量统计模型拟合优良性的一种标准，是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上。

AIC越小，模型越好，通常选择A

最低0.47元/天解锁文章

weixin_39548787

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。