DataFrame————数据离散化处理(元素定位与离散化处理)

本文主要介绍了如何在DataFrame中进行数据的离散化处理,包括元素的精准定位和离散化操作,旨在提升数据分析的效率和准确性。
摘要由CSDN通过智能技术生成
 以前老踩这坑,没总结。。。。。
数据集如下:
 
    上面age列是根据出生日期得到的年龄,我要将age连续数据离散化,改成4个年龄段的,“20~25 离散化 为数值1, 26~30 离散化为数值2, 30~35离散化为数值3 和 >35 离散化数值4 ” 的四段。修改这些数据时,需要通过行列定位再来处理, 那么就用DataFrame.loc函数,示例如下:
 
1 data.loc[(data.age >= 20) &(data.age < 25), 'age'] = 1
2 data.loc[(data.age >= 20) &(data.age < 25), 'age'] = 1
3 data.loc[(data.age >= 25) &(data.age < 30), 'age'] = 2
4 data.loc[(data.age >= 30) &(data.age < 35), 'age'] = 3
5 data.loc[data.age >=35,'age'] = 4

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值