数据挖掘---Lasso算法简介

最新推荐文章于 2024-04-22 14:24:51 发布

diemeng1119

最新推荐文章于 2024-04-22 14:24:51 发布

阅读量2.4k

点赞数

分类专栏：基础知识

基础知识专栏收录该内容

19 篇文章 0 订阅

订阅专栏

使用数理统计模型从海量数据中有效挖掘信息越来越受到业界关注。在建立模型之初，为了尽量减小因缺少重要自变量而出现的模型偏差，通常会选择尽可能多的自变量。然而，建模过程需要寻找对因变量最具有强解释力的自变量集合，也就是通过自变量选择( 指标选择、字段选择)来提高模型的解释性和预测精度。指标选择在统计建模过程中是极其重要的问题。Lasso算法则是一种能够实现指标集合精简的估计方法。　　
　　Tibshirani(1996)提出了Lasso(The Least Absolute Shrinkage and Selectionator operator )算法。这种算法通过构造一个惩罚函数获得一个精炼的模型；通过最终确定一些指标的系数为零，LASSO算法实现了指标集合精简的目的。这是一种处理具有复共线性数据的有偏估计。Lasso的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下，使残差平方和最小化，从而能够产生某些严格等于0的回归系数，得到解释力较强的模型。R统计软件的Lars算法的软件包提供了Lasso算法。根据模型改进的需要，数据挖掘工作者可以借助于Lasso算法，利用AIC准则和BIC准则精炼简化统计模型的变量集合，达到降维的目的。因此，Lasso算法是可以应用到数据挖掘中的实用算法。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘---Lasso算法简介

使用数理统计模型从海量数据中有效挖掘信息越来越受到业界关注。在建立模型之初，为了尽量减小因缺少重要自变量而出现的模型偏差，通常会选择尽可能多的自变量。然而，建模过程需要寻找对因变量最具有强解释力的自变量集合，也就是通过自变量选择(指标选择、字段选择)来提高模型的解释性和预测精度。指标选择在统计建模过程中是极其重要的问题。Lasso算法则是一种能够实现指标集合精简的估计方法。　　　　Tibshi
复制链接

扫一扫

专栏目录

diemeng1119 CSDN认证博客专家 CSDN认证企业博客

码龄15年

1: 原创

41万+: 周排名

139万+: 总排名

8万+: 访问

: 等级

643: 积分

15: 粉丝

11: 获赞

3: 评论

49: 收藏

私信

关注

热门文章

分类专栏

论文相关 1篇
基础知识 19篇
可信度 1篇
谣言
主题 1篇
C++ 1篇
web 1篇
推荐 2篇
其它 1篇

最新评论

cmd循环调用native2ascii.exe
CSDN-Ada助手: 非常感谢您分享关于cmd循环调用native2ascii.exe的经验，这篇博客对于需要处理中文编码的开发者来说一定非常有用。我觉得你可以继续写一篇关于Java编码转换的博客，介绍几种常见的编码方式以及如何进行编码转换，这样的技术文章对其他用户也一定非常有帮助。相信会有更多读者期待你的下一篇精彩博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
x2检验（chi-square test）或称卡方检验
大一也: 化疗和化疗加放疗那个例子，明显的放疗加化疗的有效率大于仅仅的化疗，为什么还要做卡方检验呢？
MAP(Mean Average Precision)
weixin_50805284: 请问rel()有具体的函数形式吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。