特征工程学习笔记

特征工程学习笔记
一.
特征工程的重要性:为了解决实际问题,通常需要收集大量的数据,这些数据未经过滤,可能非常杂乱,甚至不完整。为了更好地使用这些数据,需要对数据进行处理,这就需要用到特征工程。
特征工程是这样一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高及其学习性能。
特征工程具体包括以下几个方面:
1.转换数据的过程:这里并不特指原始数据或未过滤的数据,特征工程适用于任何阶段的数据,通常,我们要将特征工程技术应用于在数据分析者眼中已经处理过的数据,还有很重要的一点是,我们要处理的数据经常是表格形式的,数据会被组织成行(观察值)和列(属性).
2.特征:特征是对机器学习过程有意义的属性,我们经常许需要查看表格,确定哪些列是特征,哪些列只是普通的属性.
3.更好地表示潜在问题:我们要使用的数据一定代表了某个领域的某个问题,转换数据的目的是要更好地表达更好的问题.
4.提高机器学习性能:特征工程最终目的是要获取更好的数据,以便学习算法从中挖掘模式,取得更好的效果.
二.
代码实战
1.删除异常值
在这里插入图片描述2.特征构造
在这里插入图片描述在这里插入图片描述3.归一化
在这里插入图片描述4.One-Hot编码
在这里插入图片描述5.特征选择
过滤式
在这里插入图片描述包裹式
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值