你的照片,也许被用来训练人工智能了!
韦斯特于2013年拍摄的这张照片被收录在IBM的人像数据集(Diversity in Faces)中这张照片于2013年被上传到照片分享网站Flickr上时,对于面部识别系统来说有着独特的意义。照片里,人脸出现在了画面的不同位置。这样的照片能够帮助训练人工智能来识别照片和视频中的人脸。
IBM开发了一个名为“人脸多样性”的新项目,并为其准备了上百万张图片,这张其乐融融的照片就是其中之一,该项目旨在提升人脸识别的公平性和准确性。
多年来,研究人员们通过互联网收集并注释了各类物体的照片,以此来训练电脑,让其可以更好地了解它们周围的世界。通常,他们通过谷歌图片搜索、公共Instagram帐户和一些其他的途径(有些合法,有些可能不合法)获取数量巨大的图片。
得到的数据集通常被用于学术研究,比如训练或测试人脸识别算法。但随着微软、亚马逊、脸书和谷歌等公司押宝人工智能,人脸识别正走出实验室,进入大型企业的视野中。
随着消费者意识到他们在互联网上留下的数据能够产生的巨大威力,人脸识别数据集正在加剧人们对隐私和监控的担心。因此,一些研究人员正在重新审视这种野蛮收集他人照片的行径。在充满分享精神的互联网中,使用他人照片本应征求别人同意。
照片从哪里来?
由于深度学习的普及,近年来机器学习研究蒸蒸日上,人脸识别技术也得到了极大的改善。在一个典型的用例中,照片、视频或实时流媒体中的人脸会被扫描、分析,接着,它们的特征会被拿来与数据库中注释过的人脸进行比较。