python离散特征编码

本文探讨了Python中处理离散特征的编码方法,包括针对无序特征的独热编码和考虑大小意义的映射编码。通过示例展示了get_dummies函数的使用。
摘要由CSDN通过智能技术生成

离散特征编码分两种,特征具有大小意义,特征不具有大小意义。

1、特征不具备大小意义的直接独热编码

2、特征有大小意义的采用映射编码

import pandas as pd 
df = pd.DataFrame([  
            ['green', 'M', 10.1, 'label1'],   
            ['red', 'L', 13.5, 'label2'],   
            ['blue', 'XL', 15.3, 'label2']])  
# color、label不具备大小含义,size具有大小意义
df.columns = ['color', 'size', 'length', 'label']  
df


size_mapping = {  
           'XL': 3,  
           'L': 2,  
           'M': 1}  
df['size'] = df['size'].map(size_mapping)  
  
la
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值