![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文笔记
文章平均质量分 52
来路与归途
来路慢慢,情不知所起;
归途遥远,眨眼便是过去。
展开
-
an agenda-based dialog management architecture for spoken language systems阅读笔记
论文翻译https://blog.csdn.net/qq_28385535/article/details/103660466基于以下元素进行会话管理handles:最小子问题的处理函数product:反映交互的流程的结构,论文中采用树状结构反映完成任务所需信息的自然层次结构和顺序; 可以根据用户的要求在行程中添加一个节点,而不是按照固定的形式工作 每个树结点对应一个handleagenda:智能体,进行多轮对话的管理agenda除了由对应主体的handle排序的结果,还包含一些.原创 2021-02-09 17:51:39 · 195 阅读 · 0 评论 -
Real Image Restoration via Improved Data Synthesis阅读笔记
图片的两种格式的区别RGBRAW概述通常的图像去噪算法都是基于添加AWGN合成的数据集进行研究和评估;CNN网路通常在这些合成的数据集上取得了较好的效果,而在实际场景却表现一般,主要由于AWGN不足以对真正的相机噪声进行建模,真正的相机噪声是依赖于信号,并经过相机成像通道进行严格的转换(因此,图像噪声跟相机的参数十分相关);论文提出了一个网络可以对相机成像通道进行前向和反向建模简介高级视觉任务(图像分类、物体检测、语义分割)由于CNN网络已经取得了巨大的进步,主要得益于巨大的原创 2021-01-24 17:08:52 · 352 阅读 · 0 评论 -
RA-CNN阅读笔记
论文《Look Closer to See Better:Recurrent Attention Convolutional Neural Network for Fine-Grained Image Recognition》会议:CVPR-2017原创 2021-01-18 20:28:36 · 187 阅读 · 0 评论 -
图像分类
常见的图像分类有两类:多个物种之间的分类 细分子类的分类原创 2020-12-02 17:20:17 · 6390 阅读 · 0 评论 -
快速解决arxiv无法访问问题
Cornell University建立了一个论文数据库:https://arxiv.org目前,国外计算机领域的论文基本会第一时间上传至该网站,但是由于该网站在国外,国内在该网站下载论文时会显得比较慢.比如:国内镜像国内的开发人员建立了一个国内镜像网站,通过该网站,我们可以快速有效的下载我们所需要的文章.当然了有条件可以借助梯子!!推荐使用中科院的arxiv镜像http://xxx.itp.ac.cn简单直接的方法是,把要访问arxiv链接中的域名从https:原创 2020-07-14 00:40:03 · 4912 阅读 · 0 评论 -
U-Net: Convolutional Networks for Biomedical Image Segmentation阅读笔记
MICCAI 2015优点:可以利用较少的图片进行网络训练,产生更高进度的语义分割;(个人理解:实现该优点的原因,上采样时,通过与下采样的特征图进行堆叠,从而利用了下采样的卷积特征图的信息,生成更精确的结果)参考:https://blog.csdn.net/l2181265/article/details/87735610网络结构如下:...原创 2020-06-26 22:06:21 · 120 阅读 · 0 评论 -
DensePose阅读笔记
论文贡献:1.数据集的制作:通过收集SMPL模型和COCO数据集中出现的人之间的密集对应关系的数据;2.通过训练基于CNN的系统,实现了“in thewild”的图像上像素点到人体3维图的密集对应;3.提出了一个新的方法来训练模型;通过每张图像的随机采样作为一个子集,来训练一个教练网络(teacher network),来作为图像中其他像素的监督;2.数据集的介绍:DensePose-COCO Dataset2.1 Annotation System(注释系统)第一阶段,注释者标原创 2020-06-25 14:39:29 · 1357 阅读 · 0 评论 -
Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields 阅读笔记
CVPR 2017Code: https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation摘要论文提出一个高效的检测一张图片中的多个人的姿态的方法,该方法使用非参数的方法(Part Affinity Fields)来学习将图像中的每个人的各个部位连接为一个整体。该结构对全局上下文进行编码,自下而上的解析方式来同时获取高的精度和实时检测;简介推断图像中多个人的姿态,存在一系列的挑战:1.每张图像中待检测人体的个数不确定原创 2020-06-23 23:51:18 · 178 阅读 · 0 评论 -
HED:Holistically-Nested Edge Detection阅读笔记
ICCV2015论文主要解决两个问题1.基于整个图像的训练和预测2.嵌套式多尺度特征学习多尺度学习的策略图a:Multi-stream learning图b:Skip-layer network learning图c:Single model on multiple inputs图d:Training independent networks图e:Holistically-nested networks网络结构以VGGNET作为基础网络,进行如下修改:原创 2020-06-16 00:40:15 · 293 阅读 · 0 评论 -
Generalized Intersection over Union:阅读笔记
会议:CVPR2019由 a图 知 Ln范数对物体的scale不敏感,论文提出直接将IOU设为回归的loss,但iou无法直接优化没有重叠的目标,为解决这个问题,提出了GIOU的思想 GIoU假如现在有两个任意性质 A,B,我们找到一个最小的封闭形状C,让C可以把A,B包含在内,然后我们计算C中没有覆盖A和B的面积占C...原创 2020-04-19 19:15:44 · 203 阅读 · 0 评论 -
Disentangled Image Matting阅读笔记(二)
会议:ICCV-2019概述:大部分先前的图像抠图方法都需要输入一个粗略的trimap,来估计未知区域的alphad1值,论文认为trimap是粗略的,而之前的模型将trimap作为输入,试图估计一个好的蒙版,存在一个回归问题;AdaMatting一个新的端到端的图像修复框架,将任务分解为两个子任务trimap adaptation 和 alpha estimationtrima...原创 2020-03-22 13:30:38 · 379 阅读 · 2 评论 -
SPG-Net阅读笔记
SPG-Net:Segmentation Prediction andGuidance Network for Image Inpainting会议:2018概述:现有的图像修复方法主要是基于生成模型,未考虑语义信息所包含的物体形状,从而导致修复的图像边界较为模糊。论文将图像修复过程分为分割预测segmentation prediction (SP-Net)和分割指导segmentat...原创 2020-03-21 23:39:46 · 1549 阅读 · 1 评论 -
Foreground-aware Image Inpainting阅读笔记
会议:CVPR 2019论文中心思想:将图像修复的过程分为:边界预测(待修复区域覆盖前景、背景区域时,前景物体边界缺失,需要进行精确的预测),内容修复,概述:现在的图像修复方法主要的通过周围像素来修复,当修复区域与前景区域有交叠时,由于修复区域缺失前景与背景的时间内容导致修复结果不理想。 为解决该问题,作者提出了a foreground-aware image inpainting s...原创 2020-03-15 11:47:18 · 2078 阅读 · 5 评论 -
Disentangled Image Matting阅读笔记
会议:ICCV-2019概述:论文认为trimap是粗略的,而之前的模型将trimap作为输入,试图估计一个好的蒙版,存在一个回归问题;AdaMatting一个新的端到端的图像修复框架,将任务分解为两个子任务trimap adaptation 和 alpha estimationtrimap adaptation:一个像素分类问题1.依赖于对物体形状和结构的理解,...原创 2020-03-01 21:19:01 · 377 阅读 · 0 评论 -
Deep Image Matting阅读笔记
概述文章提出的算法主要分为两个部分:第一部分通过深度卷积的encoder-decoder网络,输入图像和图片对应的一个trimap,来预测图像的alpha matte(蒙板),第二部分用小型卷积网络对第一部分得到的蒙板进行微调,获得边缘更尖锐的结果。同时,文章提供了一个由49300训练图像和1000检测图像组成的抠图数据集(合成数据集)。1.介绍抠图问题的核心是精确地将图像或视频中的前...原创 2020-02-29 17:05:22 · 737 阅读 · 0 评论