良好功能的特征

最新推荐文章于 2024-09-14 19:18:15 发布

茶桁

最新推荐文章于 2024-09-14 19:18:15 发布

阅读量1k

点赞数 15

分类专栏：茶桁的 AI 会员专栏文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ivandoo/article/details/141039890

版权

茶桁的 AI 会员专栏专栏收录该内容

133 篇文章 0 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

为什么选择模型特征时预测能力并不是最重要的

可直接在橱窗里购买，或者到文末领取优惠后购买：

在这里插入图片描述

在保险业中，过去的索赔行为对未来的索赔行为具有很强的预测性。它可能是用于确定客户是否会提出索赔的唯一最具预测性的信息来源。但是，如果我们仅使用索赔历史来构建模型，它就不会很好。一般来说，模型特征应该来自各种不同的信息源。你的特征选择方法应该旨在从每个不同的信息源中创建最具预测性的特征的候选名单。

在本文中，我们将解释如何使用变量聚类和特征重要性的组合来创建这样的候选列表。我们还讨论了可能导致添加或删除特征的其他考虑因素。这些因素包括数据质量和可用性、特征稳定性、可解释性和法律/道德。最后，我们将讨论如何在特征选择框架中整合所有这些考虑因素。让我们首先准确定义特征选择的含义。

什么是特征选择？

在模型开发过程中，特征选择发生在特征工程之后、开始拟合模型之前。在特征工程期间，我们将原始数据转换为模型特征列表。根据你的问题，此列表可能很大（即超过 1000 个特征）。特征选择涉及将其缩小到一个候选列表（即 20-40 个特征）。根据你的模型，可能还有另一个特征选择阶

了解本专栏

超级会员免费看

关注

15
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

茶桁 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。