在很多时候我们想要将sklearn.datasets里面的本地数据集进行pd.操作,现记录一种通用np.Dataframe()进行构造的简单方法。
通用代码如下:
import pandas as pd
from sklean.datasets impot load_iris
iris_data = pd.DataFrame(data = load_iris().data, columns = load_iris().feature_names)
iris_data['target'] = load_iris().target
iris_data.head()
补充:
load_iris(),__doc__
可查看iris的整体信息,该信息包含各种可通过load_iris().xxx调用的各种信息。
load_iris().data
: 数据信息(array);
load_iris().target
:标签信息(array);
load_iris().target_names
:标签信息指代的名称;
load_iris().feature_names
: 属性名称;
load_iris().filename
: 文件名称;
load_iris().DESCR
: 数据集的描述信息;
![](https://img-blog.csdnimg.cn/3020c99fde104c9b84a0502e78a5f34a.png)