Python数据处理的小技巧(一)
从Sklearn Bunch对象到Pandas DataFrame对象的转换
这里提供了一个通用函数:
def sklearn_to_df(sklearn_dataset):
df = pd.DataFrame(sklearn_dataset.data, columns=sklearn_dataset.feature_names)
df['target'] = pd.Series(sklearn_dataset.target)
return df
举个例子:
假设我要用sklearn中关于乳腺癌的Bunch类型数据做转换
from sklearn.datasets import load_breast_cancer
import pandas as pd
cancer = load_breast_cancer()
Cancer = sklearn_to_df(cancer)
Cancer.head()
就可以得到如下的DataFrame对象的数据(部分):