python高级代码_python高级代码块

最新推荐文章于 2023-12-29 11:30:00 发布

买手联盟CE橙子

最新推荐文章于 2023-12-29 11:30:00 发布

阅读量306

点赞数

文章标签： python高级代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42361933/article/details/114467635

版权

# pandas dataFrame[col].value_counts() 类似

# Get number of unique entries in each column with categorical data

object_nunique = list(map(lambda col: X_train[col].nunique(), object_cols))

d = dict(zip(object_cols, object_nunique))

# Print number of unique entries by column, in ascending order

sorted(d.items(), key=lambda x: x[1])

哑变量处理,指定要处理的特征，以及列前缀

for fea in feature_cols:

df = pd.get_dummies(df,columns=[fea],prefix=fea)

如下格式尽量避免使用，因为在jion的时候有bug

embark_dummies= pd.get_dummies(train_data['Embarked'])

#get_dummies()该列有多少种可能值就用多少列表示，一列代表一种可能值，与独热编码相似

train_data = train_data.join(embark_dummies)

train_data.drop(['Embarked'],axis=1,inplace=True)

embark_dummies = train_data[['S','C','Q']]

embark_dummies.head()

categorical_features = 'all'，这个参数指定了对哪些特征进行编码，默认对所有类别都进行编码。也可以自己指定选择哪些特征，通过索引或者 bool 值来指定，看下例：

# -*- coding: utf-8 -*-

from sklearn.preprocessing import OneHotEncoder

enc = OneHotEncoder(categorical_features = [0,2]) # 等价于 [True, False, True]

enc.fit([[0, 0, 3],

[1, 1, 0],

[0, 2, 1],

[1, 0, 2]])

ans = enc.transform([[0, 2, 3]]).toarray()

买手联盟CE橙子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python高级代码_python高级代码块

# pandas dataFrame[col].value_counts() 类似# Get number of unique entries in each column with categorical dataobject_nunique = list(map(lambda col: X_train[col].nunique(), object_cols))d = dict(zip(obje...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。