9月19日,国内计算机视觉与人工智能创业企业图森互联宣布,图森互联研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得世界第一。仅KITTI数据集中,图森互联就横扫目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的全部世界第一。据悉,参加KITTI和Cityscapes评测的不乏百度、三星研究院、英伟达、UCSD、斯坦福、中科院等名企名校及科研机构。
权威的公开评测数据集是衡量算法服务商和算法团队水平的重要平台。据了解,KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。
KITTI数据集中,目标检测包括了车辆检测、行人检测、自行车等三个单项,目标追踪包括车辆追踪、行人追踪等两个单项,道路分割包括urban unmarked、urban marked、urban multiple marked三个场景及前三个场景的平均值urban road等四个单项。图森互联横扫KITTI排行榜的这九个单项,全部位列世界第一;而此前曾有国内企业获得一两个单项的世界第一。
Cityscapes数据集则是由奔驰主推,提供无人驾驶环境下的图像分割数据集。用于评估视觉算法在城区场景语义理解方面的性能。Cityscapes包含50个城市不同场景、不同背景、不同季节的街景,提供5000张精细标注的图像、20000张粗略标注的图像、30类标注物体。用PASCAL VOC标准的 intersection-over-union (IoU)得分来对算法性能进行评价。
除在自动驾驶评测数据集KITTI和Cityscapes上成绩全线飘红外,图森互联在人脸关键点定位的两个评测数据集300W和AFLW上亦排名第一。该技术主要用于驾驶员监控系统中,用于定位驾驶员面部关键点,以及时发现疲劳驾驶或违规驾驶。
据悉,北京图森互联科技有限责任公司是一家计算机视觉与人工智能算法技术提供商,主要帮助国内企业定制图像识别、自动驾驶、高级辅助驾驶、驾驶员监控系统等所需要的计算机视觉和深度学习算法。作为一家技术驱动型的人工智能创业企业,图森互联在北京和圣地亚哥设立了两座研发中心,吸纳中美两国顶尖院校科学家,成员来自加州理工学院、香港科技大学、卡耐基梅隆大学、南洋理工大学等国外知名高校和清华、北大、上海交大等国内知名学府,博士占比60%。其中,图森互联CTO侯晓迪即为加州理工学院计算与神经系统博士,创立了基于频域的视觉注意机制理论,该理论是近10年来在视觉注意机制领域最有影响力的研究;首席科学家王乃岩则是香港科技大学博士、2014 Google PhD Fellow计划入选者,多次在国际数据挖掘和计算机视觉比赛中名列前茅,同时也是将深入学习应用于目标追踪领域全球第一人。两人分别在圣地亚哥和北京各带了一支算法团队,此次图森互联横扫自动驾驶领域两大权威排行榜,两人所带团队功不可没。
图森互联此项技术已应用到公司产品和demo中。据悉,图森互联已有自动辅助驾驶demo车可以上路演示,demo车同时用于北京城区及城际高速的道路数据采集。
在自动驾驶领域,图森互联主要与运营车辆企业合作,为其定制摄像头配合毫米波雷达的低成本自动驾驶算法和解决方案。图森互联的模式与国外自动驾驶卡车公司Otto相似,后者为高速公路、矿区卡车提供自动驾驶系统。