利用Python将数值型特征进行离散化操作的方法
如下所示:
data = np.random.randn(20)
factor = pd.cut(data,4)
pd.get_dummies(factor)
00001
11000
20001
30010
41000
50100
60100
70100
80010
90100
100001
110100
120100
130010
140010
150100
160100
171000
180010
190001
其中参数中的4表示的是,划分为4段。
以上这篇利用Python将数值型特征进行离散化操作的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
时间: 2018-11-05
本文为大家分享了python数据分析数据标准化及离散化的具体内容,供大家参考,具体内容如下 标准化 1.离差标准化 是对原始数据的线性变换,使结果映射到[0,1]区间.方便数据的处理.消除单位影响及变异大小因素影响. 基本公式为: x'=(x-min)/(max-min) 代码: #!/user/bin/env python #-*- coding:utf-8 -*- #author:M10 import numpy as np import pandas as pd import matplo
本文实例讲述了Python数据分析pandas模块用法.分享给大家供大家参考,具体如下: pandas pandas10分钟入门,可以查看官网:10 minutes to pandas 也可以查看更复杂的cookbook pandas是非常强大的数据分