sklearn.datasets
返回元组(X,y),X是n_samples*n_features的矩阵表示样本特征,y是n_samples*1的矩阵表示标签
含有属性data为X,target是y
含有属性DESCR包含feature_names和target_names,表示数据集的详细描述.
返回元组(X,y),X是n_samples*n_features的矩阵表示样本特征,y是n_samples*1的矩阵表示标签
含有属性data为X,target是y
含有属性DESCR包含feature_names和target_names,表示数据集的详细描述.
load_boston([return_X_y]) 返回波士顿房价数据集,回归问题
return_X_y:默认为False,为True时返回元组(data,target)
load_iris([return_X_y])返回 鸢尾花数据集,分类问题
load_diabetes([return_X_y])返回糖尿病数据集,回归问题
load_digits([return_X_y])返回数字识别数据集,分类
load_breast_cancer([return_X_y])返回乳癌的数据集,分类问题
sklearn.datasets.fetch_olivetti_faces(data_home=None,shuffle=False,random_state=0,download_if_missing=True)
此数据集包括40个不同的人每人取10张照片,照片表示为8bit的整数,灰度值为0-256,加载时会将灰度值转化为[0,1]内方便很多算法处理
每张照片表示为64*64像素
此数据集包括40个不同的人每人取10张照片,照片表示为8bit的整数,灰度值为0-256,加载时会将灰度值转化为[0,1]内方便很多算法处理
每张照片表示为64*64像素
data_home:选择数据集的文件,默认为'../scikit_learn_data'
shuffle:boolean,如果为True则每次选择图片时打乱顺序,避免选择同一个人的图片
random_state:参数为int,RandomState instance or None.用来设置生成随机数的方式
int:作为随机数生成器的种子
RandomState instance:作为随机数生成器
None:随机数生成器采用np.random
RandomState instance:作为随机数生成器
None:随机数生成器采用np.random
download_if_missing:boolean,默认为True
如果为False,下载数据失败后生成IOError,而不是从源网站继续下载
如果为False,下载数据失败后生成IOError,而不是从源网站继续下载
(上述参数为每个函数都具有的通用参数,下面不再赘述ÿ