数据预处理:变量筛选和变换

变量筛选和变换

我们在尽心数据处理中会遇到变量的筛选问题
这里我们不是PCA(主成分分析),就是简单的人工变量筛选,
比如就像提取其中几个变量,或者想删除一些变量,还有就是某一个变量根据内容的一些简单筛选和变换。

1、选择部分变量

首先我们看下数据结构
在这里插入图片描述
定义一个x_col2来存储需要用到的变量名称
在这里插入图片描述

2、删除部分变量

如果我们要用到数据集的大部分数据,我们就可以采取删除其中的几个变量的方法
在这里插入图片描述
定义一个drops存储需要删除的变量,用一个for循环就可以把需要删掉的变量去除了

3、选取变量部分值

比如我们想筛选出y变量中为0的样本

data=data[data.y.map(lambda x: x in [0])] 

在这里插入图片描述

4、变量值的变换

比如有些离散型变量需要实际情况进行转换,一般情况下是字符串行转换成数值型
这里我们制作演示,把数值型转换为字符串,其实操作是一样的
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Andy_shenzl

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值