利用机器学习方法确定各个特征的权重

最新推荐文章于 2025-03-16 21:46:47 发布

小白的进阶

最新推荐文章于 2025-03-16 21:46:47 发布

阅读量2.1w

点赞数 5

分类专栏：机器学习机器学习文章标签：机器学习

机器学习同时被 2 个专栏收录

25 篇文章

订阅专栏

11 篇文章

订阅专栏

在有的时候，我们需要学习出特征在分类器中所占的比重，例如判断某个人是否具有贷款资格，特征收入应该比年龄要更重要一些，那么具体重要多少，我们可以通过训练数据学习出来。

第一个办法可以借鉴决策树中特征选择的思想，以贷款为例，特征向量=｛年龄，收入，有房子，婚否｝。通过计算每个特征 Ai 在训练数据集下的信息增益：

gi(D,Ai)=H(D)−H(D|Ai)，i=1,2,3,4

得到四个信息增益值，对其做归一化处理，可得每个特征所占的权重：

wi=gi(D,Ai)∑i=14gi(D,Ai)

第二个办法借鉴投票机制，选择一种分类模型，分别训练出该特征下的分类器，并在测试集中验证正确率，以训练SVM分类器为例，
1、在训练数据集D下分别训练出四个SVM分类器，每个分类器都是关于单特征的分类器，如分类器 S1 是关于单特征年龄的；
2、在测试集 Dt 下分别测试四个分类器的分类效果，并统计正确分类个数 counti，i=1,2,3,4 分别表示四个特征下的正确分类数；
3、对第二步求出的 counti 做归一化处理，即可得到特征的权重 wi=counti∑i=14counti 。

基于投票机制，还可以考虑利用缺一法来求得特征权重，过程如下：
1、在训练数据集D下，分别训练缺少了第 i 个特征的分类器，如分类器 S1 的特征为｛收入，有房子，婚否｝；
2、在测试集 Dt 下分别测试四个分类器的分类效果，并统计错误分类个数 counti，i=1,2,3,4 分别表示四个特征下的错误分类数。
3、对第二步求出的 counti 做归一化处理，即可得到特征的权重 wi=counti∑i=14counti

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。