机器学习算法与Python实战 | 8个特征工程技术,提高机器学习预测能力

本文来源公众号“机器学习算法与Python实战”,仅用于学术分享,侵权删,干货满满。

原文链接:8个特征工程技术,提高机器学习预测能力

在机器学习方面,人们可以采取的改进 ML 模型预测的方法是选择正确的特征并删除对模型性能影响微不足道的特征。因此,选择正确的特征可能是数据科学家或机器学习工程师需要做的最重要的步骤之一,他们通常负责构建那些能够很好地概括测试数据集的复杂模型。

例如,考虑预测一个人是否会患心脏病的任务,可以产生良好影响的最强指标之一就是体重指数 (BMI)。当我们试图预测一个人可能患有的血压 (BP) 水平时,没有考虑这个特征并且没有在我们的数据集中使用它,通常会导致结果不太准确。在这种情况下,BMI 可以强烈表明一个人患有这些疾病。因此,考虑这个特征很重要,因为它会对结果产生很大的影响。

考虑另一个预测某人是否会拖欠贷款的案例研究。在向某人提供贷款之前,所考虑的银行会询问一系列问题,例如工资、净资产和他们的信用记录。如果我们要让一个人根据上述一系列因素来决定是否必须向某人提供贷款,他/她会查看总工资和他们的整体信用记录。

同样,当数据以与人类相同的方式提供给 ML 模型时,它会学会获得重要的表示,以便它决定一个人是否会偿还贷款。如果我们删除诸如工资之类的特征,ML 模型将缺少关键信息,无法完美地解读一个人是否会偿还贷款。因此,它的预测可能会非常错误,因为数据中缺少最重要的特征之一(工资)。因此,这凸显了拥有正确的特征对于我

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值