约定
import pandas as pd
离散化
通常对于我们不想要连续的数值,我们可将其离散化,离散化也可称为分组、区间化。
Pandas为我们提供了方便的函数cut():
pd.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
参数解释:
- x:需要离散化的数组、Series、DataFrame对象
- bins:分组的依据
- right:传入False则指定左边为闭端
# 假设有一组人员的年龄
ages=[20,19,30,34,23,40,50]
se_ages=pd.Series(ages)
<