核心方法:pd.get_dummies()
首先我们看一个包含分类数据的例子:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
file=pd.read_csv('Churn_Modelling.csv')
file=file.iloc[:,3:]
file.head(10)
我们可以看到实例数据中的分类数据
关键来了,我们用巧妙调用pandas.dummy就可以把分类数据转化为虚拟数据(dummy variable)
dummy=pd.get_dummies(file)
dummy.head(10)