最近发现了微软也有类似谷歌的图片搜索下载API,可以方便的根据关键字获取海量的数据,并下载保持到本地,作为初始数据,解决巧妇难为无米之炊的烦恼。
-
注册微软azure 账户
-
申请图像搜索api
-
根据下面代码,修改相应的参数
必应搜索 API v7
此 API 密钥当前处于活动状态
剩余 7 天
必应搜索 API v7 采取了各种增强措施:例如,必应 Web 搜索提升了性能,必应图像搜索新增搜索筛选器,必应视频搜索和必应图像搜索简化了分页,以及改进了错误处理流程。
此试用版是捆绑包的一部分,包含所有必应搜索 API(Web、图像、视频、新闻、实体搜索和视觉搜索)以及拼写更正、相关搜索和其他可用结果。必应视觉搜索终结点每月支持 1,000 个事务,每秒高达 1 个,而其他终结点每月支持 3,000 个事务,每秒高达 3 个。试用密钥将在 7 天后到期,届时可在 Azure 门户上购买订阅。
在程序代码里使用方法,代码样本如下:
!pip install -Uqq fastbook
import fastbook
fastbook.setup_book()
#hide
from fastbook import *
from fastai2.vision.widgets import *
key = '这里写上你申请的key' #如果是免费的key可以用7天
search_images_bing
results = search_images_bing(key, 'grizzly bear') #这里的关键字可以改成你自己的关键字
ims = results.attrgot('content_url')
len(ims)
bear_types = 'grizzly','black','teddy'
path = Path('bears')
if not path.exists():
path.mkdir()
for o in bear_types:
dest = (path/o)
dest.mkdir(exist_ok=True)
results = search_images_bing(key, f'{o} bear')
download_images(dest, urls=results.attrgot('content_url'))
效果如下:
整体效果还不错,
这样就只使用了几分钟时间,解决了项目模型初期缺少数据集的问题。