pandas学习笔记:某一列字符类型转换为离散的数值标签;将某一列数值类型转换成独热码

import pandas as pd

将字符串变成离散的数值

  • 整个“性别”列只有男和女
df = pd.DataFrame({"性别":["男","女","女","女","男","男","男","男","男","女","女","男"]})
df
性别
0
1
2
3
4
5
6
7
8
9
10
11
  • 将性别转换成可以用作数据分析的特征,把性别用离散值来表示
df["性别"] = pd.Categorical(df["性别"]).codes
df
性别
01
10
20
30
41
51
61
71
81
90
100
111

将离散的数值变量变成独热码

from keras.utils import to_categorical
y = to_categorical(df["性别"],num_classes=2)
y
array([[0., 1.],
       [1., 0.],
       [1., 0.],
       [1., 0.],
       [0., 1.],
       [0., 1.],
       [0., 1.],
       [0., 1.],
       [0., 1.],
       [1., 0.],
       [1., 0.],
       [0., 1.]], dtype=float32)
pd.concat([df,pd.DataFrame(y)],axis=1)
性别01
010.01.0
101.00.0
201.00.0
301.00.0
410.01.0
510.01.0
610.01.0
710.01.0
810.01.0
901.00.0
1001.00.0
1110.01.0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暖仔会飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值