分词之后的如何做特征选择_前向、后向、双向特征选择

最新推荐文章于 2023-09-11 00:03:57 发布

VIP文章 weixin_39838362

最新推荐文章于 2023-09-11 00:03:57 发布

阅读量708

点赞数 1

文章标签：分词之后的如何做特征选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39838362/article/details/111652434

版权

前向、后向和双向特征选择，属于包裹式特征选择，理论上来说，对于所有的算法都可以使用这样的思想。

1、前向特征选择：

首先从所有特征中选择特征的重要性最大的特征入模型，这里如何衡量特征的重要性有很多很多的方法，比如tree的feature_importance,比如各种过滤式特征选择的特征衡量指标：gini、卡方值等等，比如模型的评价指标：auc、ks等等也可以用于定义特征的重要性程度。不过在线性模型中比较常见的衡量标准还是aic和bic。

不过线性模型中还有一个麻烦的地方在于，每次选入的特征还要进行F检验和T检验等，其实不用这么麻烦的。。。数据量大的时候一般不怎么做假设检验。。。

补充说明：

AIC和BIC准则www.jianshu.com

很多参数估计问题均采用似然函数作为目标函数，当训练数据足够多时，可以不断提高模型精度，但是以提高模型复杂度为代价的，同时带来一个机器学习中非常普遍的问题——过拟合。
所以，模型选择问题在模型复杂度与模型对数据集描述能力（即似然函数）之间寻求最佳平衡。
人们提出许多信息准则，通过加入模型复杂度的惩罚项来避免过拟合问题，此处我们介绍一下常用的两个模型选择方法：
1赤池信息准则（Akaike Informatio

最低0.47元/天解锁文章

weixin_39838362

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分词之后的如何做特征选择_前向、后向、双向特征选择

前向、后向和双向特征选择，属于包裹式特征选择，理论上来说，对于所有的算法都可以使用这样的思想。1、前向特征选择：首先从所有特征中选择特征的重要性最大的特征入模型，这里如何衡量特征的重要性有很多很多的方法，比如tree的feature_importance,比如各种过滤式特征选择的特征衡量指标：gini、卡方值等等，比如模型的评价指标：auc、ks等等也可以用于定义特征的重要性程度。不过在线性模型中...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。