1、机器视觉算法基础和主流深度学习框架介绍(笔记)

机器视觉:对图像和视频用算法进行模式识别和数据挖掘。

图像挖掘的一般过程如下,运用图像处理技术,如图像分割、边缘探测、边缘提取、模式识别等,从图像视频帧)中抽取能代表、区分该图像的结构化内容的特征,同时收集用于图像处理和数据挖掘所需要的知识,获得各种元数据及领域知识,建立特征库和知识库。

深度学习的图像分割技术主要分为两类

语义分割(semantic segmentation)及实例分割(instance segmentation)

语义分割:会为图像中的每个像素分配一个类别,但是同一类别之间的对象不会区分。

实例分割:其实就是目标检测和语义分割的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体(猫1,猫2,猫3…)(图1、图2)

(图1)

(图2)

深度学习的发展

机器视觉应用方向:

汽车导航、动漫特效(风格迁移)、视频理解自动剪辑(利用前面的帧和后面的帧,识别下图中的高亮镜头,下图)、人脸识别(识别表情甚至是眼睛的位置)

下图为有名的几大主流框架,张老师建议只学pytorch即可,目前最受开发者喜欢的框架

OpenMMLab是基于pytorch的各种算法的一个集合,包含了各种检测。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大胡子大叔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值