Pandas连续数据的离散化,cut、qcut

先创建一个DataFrame测试

import pandas as pd
import numpy as np
d = pd.DataFrame(np.random.randint(0, 50, (10, 6)),
                index=list('ABCDEFGHIJ'),
                columns=list('abcdef'))

在这里插入图片描述

1、等宽法、将数据划分为n等份

把a列的每一个元素的区间都分出来
在这里插入图片描述
展示每一个区间的元素个数
在这里插入图片描述
对结果不排序
在这里插入图片描述

2、等频法、 以相同数量的记录放进每个区间

qcut()是按照分位数对样本进行划分的,这样划分的结果是的每个区间的大小基本相同,但不一定完全相同。例如把a列分成4等份,就是按照四分位数划分的
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值