Pandas Pandas中利用pd.get_dummies()实现One-Hot编码
pandas 中的 get_dummies 方法主要用于对类别型特征做 One-Hot 编码(独热编码)
直接上示例,开搞!!!
读取本地数据:
import pandas as pd
import matplotlib.pyplot as plt
columns = ["mpg", "cylinders", "displacement", "horsepower", "weight", "acceleration", "year", "origin", "car name"]
cars = pd.read_table("dataset/auto-mpg.data", delim_whitespace=True, names=columns)
cars.head(5)
打印效果:
# 查看数据值
cars["cylinders"].unique()
打印效果:
get_dummies 方法对类别型特征做 One-Hot 编码(独热编码)
dummy_cylinders = pd.get_dummies(cars["cylinders"], prefix="cyl") # 用于改变数据的样式,有点one-hot编码的味道
dummy_cylinders
打印效果: