计算机视觉的终极目标

计算机视觉的终极目标:让计算机自动理解图片(视频)的内容。
这个终极目标的核心其实可以拆解为一下几个任务:
1. 让计算机理解图片的场景(咖啡厅, 教室, 博物馆, 等等),
2. 理解场景中包含的物体(餐具,交通工具,人, 动物等等),
3. 理解物体所在图片中的位置(bounding box边界框的坐标, 物体的边界点),
4. 理解物体之间的关系和行为(是在交谈, 体育比赛,对抗, 等等), 以及图片所表达的抽象含义(例如表达讽刺挖苦, 暴力色情, 艺术,宗教的神圣, 大自然的壮阔, 节日的喜庆, 等等)。

如果我们可以让计算机做到这些,那么这个计算机视觉的终极目标就是可以达成的。而这些拆解完成的任务,单独或结合,也都构成了计算机视觉领域,今天在工业界和企业界中的的重要应用点。

转载链接:https://mp.weixin.qq.com/s/2VbHwigMdIHkAzynvKoDsQ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值