【转】喜报｜科大讯飞摘取Cityscapes评测桂冠，刷新世界记录！

最新推荐文章于 2024-08-08 07:45:18 发布

lanyuxuan100

最新推荐文章于 2024-08-08 07:45:18 发布

阅读量1k

点赞数

分类专栏： Deep Learning 文章标签： segmentation

Deep Learning 专栏收录该内容

112 篇文章 1 订阅

订阅专栏

转自：https://baijiahao.baidu.com/s?id=1582931047168007698&wfr=spider&for=pc

近日，科大讯飞在国际自动驾驶领域权威评测集Cityscapes获得平均81.4%的精度，取得了该项评测的第一名，并刷新了世界记录。这也是今年科大讯飞继医学影像权威评测LUNA之后在计算机视觉领域获得的又一殊荣。

科大讯飞名列Cityscapes榜首

Cityscapes评测数据集在2015年由奔驰公司推动发布，是目前公认的自动驾驶领域内最具权威性和专业性的图像语义分割评测集之一，其关注真实场景下的城区道路环境理解，任务难度更高且更贴近于自动驾驶等热门需求。截至目前，Cityscapes评测吸引了超过40支队伍参赛，包括Google、香港中文大学等众多国内外优秀创新企业和顶尖学术机构。

Cityscapes评测集如何判定结果？

Cityscapes评测集包含50个城市不同情况下的街景，以及30类物体标注。此次科大讯飞参加的像素级场景图像语义分割评测，类别对象多、场景复杂，挑战难度大。Cityscapes使用标准的PASCAL VOC IoU（intersection-over-union）得分来评估预测结果与真实场景之间的匹配准确度，每个像素点的预测结果都会直接影响到最终得分。

左：真实场景中：场景标注右：讯飞算法预测结果

科大讯飞刷新世界纪录的法宝是？

此次评测，科大讯飞借鉴了已在教育图文阅卷中成功应用的复杂版面分析技术，并结合道路场景解析的特殊问题进行算法迁移，构建了一套具有丰富上下文信息的多层次图像语义分割方案。

根据道路场景下不同对象间的空间关联性，科大讯飞设计出多层次模型预测框架，将多类别“难例预测”简化并分治，同时借鉴多尺度混合感受野的模型设计，加入基于预测对象尺寸自适应调整权重的过程，对上下文信息和物体结构性信息进行更有效地利用。

像素级场景图像语义分割有什么重要意义？

提供参考

像素级场景图像语义分割被喻为自动驾驶中目标识别模块最精确和难度最大的算法，分割的结果可以为行车电脑提供更加丰富和全面的路况参考信息，为后续高级别自动驾驶中的路径规划以及相关的决策提供指导依据。

简化流程

相比于行人检测、物体识别等算法需要系统再次推导空间路径，图像语义分割算法的输出使得整体决策流程更加简化，缩短判决时间的同时又不失安全性。

减少失误

高精度图像语义分割技术为驾驶控制提供更准确的决策参考，其算法效果上每一次细微的改进，都可能意味着真实环境中判决失误次数的极大减少，由此导致的事故率也随之降低，这正是自动驾驶真正诉求的价值所在。

科大讯飞在计算机视觉领域发展如何？

科大讯飞在人工智能领域全面发展，在基于深度学习的通用核心技术上有着深厚积累。不仅在智能语音、机器翻译等相关的多项国际权威赛事取得第一，实际上，科大讯飞在教育图文、人脸识别等计算机视觉领域也深耕多年，拥有丰富的经验和国际领先的技术，并已运用在教育、医疗、金融等多个行业。

今年8月，科大讯飞在国际医学影像领域的权威评测LUNA中以显著优势获得第一、刷新世界纪录，证明在计算机视觉与医学影像结合的重要领域已走到世界前列；此次Cityscapes再下一城，充分彰显科大讯飞在计算机视觉领域的技术水平，以及在智能驾驶等新方向的研究拓展能力。

未来，科大讯飞将继续核心源头技术的创新，秉持让机器“能听会说，能理解会思考”的使命，在计算机视觉领域持续发力，推动算法演进与应用行业的深度合作，用人工智能建设美好世界！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。