特征锦囊:对有序类别特征进行映射处理

81b8e0d291fe8635633703a66f3b2a8f.png

今日锦囊

特征锦囊:对有序类别特征进行映射处理

🚅 Index
  • 直接上代码

🎯 直接上代码

有些算法对有序分类变量(ordinal feature)的解释还是不行的,我们需要将其转为整型数值。unfortunately,并没有能够直接调用的方法来自动得到正确顺序的有序分类变量。因此,我们要自己定义映射函数,把带有“顺序属性”的类别变量进行映射,转化成数值型变量。比如下面的案例,这4个变量(特征)中,【尺寸】就是有序分类变量,因为尺码虽然是类别变量,但是其实这些字母是有大小区分的。

import pandas as pd
df = pd.DataFrame([['green', 'M', 10.1, 'new balance'],
                   ['red', 'L', 13.5, 'Nike'],
                   ['blue', 'XL', 15.3, 'new balance']])
df.columns = ['颜色', '尺寸', '单价', '牌子']
df
e06d14cbb13c90267319cf43b931ba29.png
size_mapping = {'XL': 3,
                'L': 2,
                'M': 1}
df['尺寸'] = df['尺寸'].map(size_mapping)
df
57db2a585b56c50af0da44e81e32d2da.png
# 反映射字典 
inv_size_mapping = {v: k for k, v in size_mapping.items()}
df['尺寸'] = df['尺寸'].map(inv_size_mapping)
df
cc12f3f46980a04916a48f4c022ab847.png

f604f645b47ee2a6cbe511385b061f3d.png

广而告之

c0ad960e4f2978eb07ca5910616243c5.png

PICK ME

朋友们,阿Sam这边也开通了小红书账号,也会定期发布一些机器学习、风控挖掘、特征工程等相关工程(几乎日更哦),欢迎大家也关注关注,哈哈~

182ebc2f848beddecdc944f187495a23.png

a86a21176d1dc6ace556c85975d70424.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值