pandas.cut()实现数据离散化

最新推荐文章于 2022-07-20 19:24:34 发布

linda公馆

最新推荐文章于 2022-07-20 19:24:34 发布

阅读量1.6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40078436/article/details/107743901

版权

数据离散化一般用来把采集到的数据点分散到设定好的多个区间中，或者在不同的区间内选择特定数据值代表该区间的数据。pandas的cut函数实现数据离散化操作。
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=‘raise’)
参数：
x：表示要分箱的数组，必须是一维的。
bins：int或序列类型的数据。int类型的值表示在x范围内的等宽单元的数量（划分为多少个等间距区间）；序列表示将x划分在指定的序列中，若不在此序列中，则为NaN。
right：是否包含右端点，默认True。
labels：用于生成区间的标签。
rebins：是否返回bins。
precision：精度，默认保留三位小数。
include_lowest：是否包含左端点，默认False。
返回值：Categorial对象，包含区间划分的数量和各区间范围。

（1）在要分箱的数组范围（(最小指，最大值]）内划分等间距区间

import pandas as pd
x = [30, 90, 0, 70, 100]
pd.cut(x, 5)

在这里插入图片描述
（2）把要分箱的数组划分在

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas.cut()实现数据离散化

数据离散化一般用来把采集到的数据点分散到设定好的多个区间中，或者在不同的区间内选择特定数据值代表该区间的数据。pandas的cut函数实现数据离散化操作。pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates=‘raise’)参数：x：表示要分箱的数组，必须是一维的。bins：int或序列类型的数据。int类型的值表示在x范围内的等宽单元的数量（
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。