问题
sklearn.datasets导入数据集时,经常会发生URLError: <urlopen error [Errno 11001] getaddrinfo failed>错误。
这里以fetch_lfw_people数据集为例提出解决办法,其他数据集类似
问题分析
导致这一问题的主要原因是:数据集时下载失败或者电脑上没有缓存的数据集,其中数据下载失败的一个原因是不分数据在国内无法下载
解决问题
1、查找数据集的缓存默认地址,使用get_data_home()函数
2、下载所需的sklearn.datasets数据集,在本文末尾。
3、将下载好的数据集存放到缓存地址下,或者将fetch_lfw_people()函数中的datahome参数改成当前数据地址
方法一:将下载的数据文件放在默认地址中
方法二:在调用数据集时data_h