python数据类型有序无序,python数据类型有序无序_python中的有序和无序类别变量...

类别变量转化为数字,需要区分是否是有序类别,如 male和female,就是无序的,应该转化成(1,0)和(0,1),但衣服大小,M,L,XL,则应转化为1,2,3

若将无序属性连续化,则会不恰当的引入序关系,对后续处理如距离计算等造成误导

类别变量转化的Python实现:

1、有序的类别变量

有序的类别变量转化,一般直接采用赋值、映射的方法即可,可以采用Python带的map函数。

比如size:[X,XL,XXL],使用数值的映射{X:1,XL:2,XXL:3}。

2、无序的类别变量

无序的类别变量转化,一般对应的转码方式为 one-hot编码,采用pd.get_dummies(df) 就可以。

具体代码如下

(1)有序:import pandas as pd

df = pd.DataFrame([

['green', 'M', 10.1, 'class1'],

['red', 'L', 13.5, 'class2'],

['blue', 'XL', 15.3, 'class1']],

)

df.columns = ['color', 'size', 'prize', 'class label']

#DataFram相当于一个数据表,DataFrame(data,columns=['a','b','c'],index=['one','two','three']) ,有这些参数

#上面的代码可以写成,data = [

['green', 'M', 10.1, 'class1'],

['red', 'L', 13.5, 'class2'],

['blue', 'XL', 15.3, 'class1']]

# df = pd.DataFrame (data,columns = ['color', 'size', 'prize', 'class label'])

size_mapping = { 'XL': 3, 'L': 2,'M': 1} #建立一个字典,构建键值对,即数据映射。

df['size'] = df['size'].map(size_mapping) # map函数的使用

将 M,L,XL转化成了1,2,3

(2)无序pd.get_dummies(df)

将color和class两列,转化成了one_hot编码

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值