最近在实践人脸识别,目标检测等的项目,需要用到数据集的构建,从https://www.pyimagesearch.com/2018/04/09/how-to-quickly-build-a-deep-learning-image-dataset/找来资源,以供学习。我的项目地址:我的Github。
1、介绍
为了构建我们的深度学习图像数据集,我们将利用微软的Bing图像搜索API,这是微软认知服务的一部分,用于将AI应用在视觉,语音,文本等的软件。
2、创建您的Cognitive Services帐户
点击下面的网页进入:
https://azure.microsoft.com/en-us/try/cognitive-services/?api=bing-image-search-api
如截图中,要注册Bing图像搜索API,请单击“获取API密钥”按钮。
从那里您可以通过登录您的Microsoft,Facebook,LinkedIn或GitHub帐户进行注册(为了简单起见,我使用GitHub)。
完成注册过程后,您将在您的API页面看到类似于我的浏览器的页面:
3、使用Python构建深度学习数据集
3.1 阅读文档
如果您对 API如何工作或我们在发出搜索请求后如何使用API 有任何疑问,您应该参考这两个页面。
3.2 安装requests包
$ workon your_env_name
$ pip install requests
3.3 创建脚本文件SearchBingAPI.py来下载图像
'''
任务: 利用BING API从网上抓取特定图片,作为人脸识别的数据集。
操作: 1. 在linux下,命令行输入: python SearchBingAPI.py --query "钟汉良" --output DataS