学习离散化的多种方法
andas的qcut()可以把一组数字按大小区间进行分区
qcut() 方法第一个参数是数据,第二个参数定义区间的分割方法。
把数字分成两半,那就是 [0, 0.5, 1] 如果要分成4份,就是 [0, 0.25, 0.5, 0.75, 1] ,也可以不是均分。比如 [0, 0.1, 0.2, 0.3, 1] ,这就就会按照 1:1:1:7 进行分布。
- data = pd.Series([0,8,1,5,3,7,2,6,10,4,9])
- print(pd.qcut(data,[0, 0.1, 0.2, 0.3, 1],labels=['first 10%','second 10%','third 10%','70%']))