数据需要进行机器学习预测,发现某些字段的数据类型是object,现将这些字段类型转换为int类型:
第一种使用元素索引对应进行转换:
#类型转换
n = ['education','marital_status', 'occupation', 'relationship',
'race', 'sex','native_country']
for i in n:
unique = data[i].unique()
def transform(type):
index = np.argwhere(unique==type)[0,0]
return index
data[i] = data[i].map(transform)
第二种使用字典进行转换:
#类型转换
n = ['education','marital_status', 'occupation', 'relationship',
'race', 'sex','native_country']
for i in n:
un = df[i].unique()
mapping = dict(zip(un, range(len(un))))
df[i] = df[i].map(mapping)