计算机视听觉机理和方法,计算机：会听会看能思考--传媒--人民网

最新推荐文章于 2021-07-26 13:16:08 发布

ATAH

最新推荐文章于 2021-07-26 13:16:08 发布

阅读量226

点赞数

文章标签：计算机视听觉机理和方法

走在大街上，你能从车流声、叫卖声、音乐声中分辨出同伴的絮语；随意扫一眼，各家店铺的商品就一目了然……对于人类来说，识别图像、语音和文本信息，再据此决定自己的行为，并不是难事。可如果将这一任务交给计算机来完成呢？尽管现代计算机的运算速度早已令人类无法企及，但在处理这些可被人类直接感知和理解的信息方面，计算机的能力却远逊于人类，“也许连幼儿园的孩子都不如”，中国工程院院士郑南宁说。正因为如此，国家自然科学基金委员会设立了重大研究计划——“视听觉信息的认知计算”，希望借鉴认知机理和数学等相关最新研究成果，建立新的模型和方法，提高计算机对这类信息的理解能力和处理效率。

无人车“考验”计算机理解能力

在看到图像，听到语言时，人类的大脑如何从庞杂的信息中择取对自己有用的信息，理解这些信息的含义，并以此来主导自己的行为？这是一个至今仍让科学家不断追索的问题。然而，在大量不可预测的人类行为中，总有一些人类行为是符合逻辑的，这意味着，我们可以根据一些预先设定好的，大家共同遵守的规则，对这类行为进行事先的推理。比如，当你开车在路上遇到了红灯，或者看到了写着“停”字的交通标志牌，这个时候，对你接下来行为的推理，就是你会“停车”。

在“视听觉信息的认知计算”重大研究计划项目组的科研人员看来，按照交通规则驾驶车辆行驶，是适合计算机模拟的人类行为，因为这个过程符合逻辑推理，也比较容易验证模拟的结果——如果在红灯时停车，绿灯时前行，遇到行人时会避让，这就说明，对于视觉图像的获取是准确的，对这个图像所传达信息的理解是正确的。

正是基于这样的理解，在“视听觉信息的认知计算”这个重大研究计划中出现了无人驾驶汽车，随之诞生了“中国智能车未来挑战赛”。尽管人们极为关注每一辆无人驾驶汽车在比赛中的表现，但在重大研究计划中，无人驾驶汽车所扮演的角色并不仅仅是“中国智能车未来挑战赛”中的“选手”，它们有更重要的任务——验证图像与视觉信息的计算、语音与听觉信息的计算、脑—机接口这些方面的研究成果。

ATAH

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算机视听觉机理和方法,计算机：会听会看能思考--传媒--人民网

走在大街上，你能从车流声、叫卖声、音乐声中分辨出同伴的絮语；随意扫一眼，各家店铺的商品就一目了然……对于人类来说，识别图像、语音和文本信息，再据此决定自己的行为，并不是难事。可如果将这一任务交给计算机来完成呢？尽管现代计算机的运算速度早已令人类无法企及，但在处理这些可被人类直接感知和理解的信息方面，计算机的能力却远逊于人类，“也许连幼儿园的孩子都不如”，中国工程院院士郑南宁说。正因为如此，国家自然...
复制链接

扫一扫