计算机视觉
文章平均质量分 80
米之炼金术师
动物界,脊索动物门,哺乳纲,灵长目,人科,人属,人种
展开
-
视频分析模型(行为识别):C3D
C3D文章目录C3D1. 简介1.1 背景1.2 C3D特点1.3 视频描述符1.4 C3D的结果2. 架构2.1 工作流程2.2 网络结构2.3 3D卷积和池化2.4 kernel 的时间深度3. 可视化3.1 特征图3.2 特征嵌入4. 应用场景4.1 动作识别4.2 动作相似度标注4.3 场景和目标识别4.4 运行时间分析1. 简介论文:https://arxiv.org/abs/1412.0767v4github:原代码:https://github.com/facebook/C3DTe原创 2020-06-30 23:29:00 · 15576 阅读 · 1 评论 -
深度学习视频数据集(动作识别):UCF-101
UCF-101官网:https://www.crcv.ucf.edu/research/data-sets/ucf101/网盘:链接:https://pan.baidu.com/s/1RsJuykWyUlQ4_c1TwqxR_Q提取码:909g官方解释UCF101是一个现实动作视频的动作识别数据集,收集自YouTube,提供了来自101个动作类别的13320个视频。该数据集是UCF50数据集的扩展,UCF50数据集有50个动作类别。UCF101在动作方面提供了最大的多样性,并且在摄像机运动、对原创 2020-06-30 23:05:33 · 18514 阅读 · 9 评论 -
使用UNet进行图像分割(Pytorch搭建)
使用UNet进行图像分割(利用Pytorch搭建)文章目录使用UNet进行图像分割(利用Pytorch搭建)简述环境准备代码数据集模型训练结果简述这里介绍一下如何使用Pytorch搭建一个UNet的图像分割模型,并训练出效果,论文中的一些trick这里没有使用。只包含简单的几个模块,并且大部分代码都有注释。环境平台:Windowspython版本:3.7Pytorch版本:torch:1.3.0,torchvision:0.4.0准备在搭建模型之前,我们还需要做些准备工作,那就是搜集数据原创 2020-05-23 23:06:49 · 34362 阅读 · 72 评论 -
图像分割(六):模型(MaskRCNN)
文章目录三、图像分割的模型8.Mask RCNN三、图像分割的模型8.Mask RCNN原论文Mask RCNN其实就相当于Faster RCNN + Mask(FCN),也就是在Faster RCNN的基础上,增加了一个分支用作图像分割。其模型结构为:同样是two-stage的模型,相较于Faster RCNN的区别:增加了一个分支mask,用于图像分割:对于Faster ...原创 2020-04-22 12:07:21 · 1972 阅读 · 2 评论 -
图像分割(四):模型(PSPNet)
文章目录三、图像分割的模型7.PSPNet三、图像分割的模型7.PSPNet原论文(CVPR 2017 v2)这个模型最核心的贡献就是提出了全局金字塔池化模块:Pyramid Pooling Module(一个不同尺度的pooling模块),其能够融合不同尺度的上下文信息,提高获取全局特征信息的能力,增加了模型的表现力。模型结构为:模型的工作流程为:输入图像CNN提取特征(带...原创 2020-04-22 12:06:01 · 1363 阅读 · 0 评论 -
图像分割(三):模型(Deconv Net、SegNet)
文章目录三、图像分割的模型5.Deconv Net6.SegNet三、图像分割的模型5.Deconv Net原论文2015年的模型,其网络结构为:这是一个基于VGG16改进而来的模型,标准的哑铃结构,左右对称,输入与输出大小一致。下采样部分使用的是VGG16的前13层,共计13层卷积,中间还夹杂有Relu和MaxPooling,下采样之后,中间连着两层全连接以增强分类效果。上采样部...原创 2020-04-22 12:04:45 · 1186 阅读 · 0 评论 -
图像分割(五):模型(DeepLab)
文章目录三、图像分割的模型4.DeepLab三、图像分割的模型4.DeepLab原论文(v3+)相关论文:空洞卷积最早的版本是2014年发表的,后面又有几个版本的改进。Deeplabv1:使用CRF后处理,提高分割边界的精确度;Deeplabv2:使用空洞卷积扩大感受野,使用ASPP实现多尺度预测和上下文信息提取;Deeplabv3:不使用后处理,使用编-解码结构提高分割边界预...原创 2020-04-22 12:04:10 · 873 阅读 · 0 评论 -
图像分割(七):模型(U-Net、U-Net++)
文章目录三、图像分割的模型2.U-Net3.U-Net++三、图像分割的模型2.U-Net**原论文:**https://arxiv.org/pdf/1505.04597.pdf这是2015年,与FCN同一年提出的网络模型,U-Net主要解决的是医学领域的图像分割问题,由于其网络结构为一个U型,故名为U-Net。这是一个对称的生成模型,左边部分下采样进行特征提取,右边部分上采样,将浓缩...原创 2020-04-22 12:00:51 · 9069 阅读 · 1 评论 -
图像分割(二):模型(FCN)
文章目录三、图像分割的模型1. FCN三、图像分割的模型1. FCN**原论文:**https://arxiv.org/pdf/1605.06211.pdfFCN(Fully Convolutional Networks),全卷积网络,2015年发表,算是深度学习图像分割模型的鼻祖。其核心思想为:使用不包含全连接的全卷积网络,所以可以输入任意大小的图片。使用跳跃连接,以结合不同尺度...原创 2020-04-22 11:51:48 · 4039 阅读 · 0 评论