浅谈计算机视觉与自然语言处理

原创:杨其泓

1. 计算机视觉

1.1. 什么是计算机视觉

计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学, 更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和 测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因,是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,使之具真正具有了实际应用的能力(要不然别人会说:你找几个人来干不是更好吗),同年Google也开源了自己的深度学习算法。
计算机视觉的众多实际应用,细化下来都可以拆分成某个具体任务。

计算机视觉四大任务
计算机视觉四大任务

  1. 图像分类:把图像划归为若干个类别中的某一种
  2. 图像分类+定位:把图像划归为若干个类别中的某一种,并给出被分类物体的位置
  3. 物体检测:用框去标出图像中物体的位置,并给出物体的类别(人脸检测、安全帽检测、车辆检测都属于这个)
  4. 图像分割:以像素级单位把图像分成若干个特定的、具有独特性质的区域并给出物体的类别(车道线分割项目就是用的这个,属于自动驾驶的一部分)

1.2. 基本任务流程

计算机视觉任务的主要流程有图像获取、预处理、特征提取、检测/分割和高级处理共计5个步骤。

  • 0
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值