论文 读书笔记
文章平均质量分 88
时光机゚
为了我的名字~。~
展开
-
【论文阅读笔记】Fast Bilateral Filtering for the Display of High-Dynamic-Range Images
在拍照过程中,光线管理不善—主要角色之后的光线区域曝光不足或者过度是照片坏照的最常见原因。这就是相机制造商开发复杂的曝光测光系统的原因。不幸的是,曝光只能通过全局对比度管理。也就是说,它会将强度窗口重新定位在最相关的范围内。如果强度范围太大,照片将包含曝光不足和过度曝光的区域,如下图111最右边所示。本文的方法,将高动态范围图像作为输入,并在保留图像细节的同时压缩对比度,如Tumblin [1999]所介绍的那样。原创 2023-06-07 12:04:07 · 1072 阅读 · 0 评论 -
【论文阅读笔记】Edge-Preserving Decompositions for Multi-Scale Tone and Detail Manipulation
作者认为,双边滤波非常适合去躁和精细尺度上的细节提取。但作者认为其不太合适任意尺度的细节提取,而任意尺度的细节提取对于多尺度解耦是必要的。比如,为了减少HDR图像的动态范围,通常对基础层进行非线性压缩映射,然后与(可能衰减或增强的)细节层重新组合[Pattanaik et al. 1998;Fattal et al. [2007]采用了相似的过程来增强形状和细节,除了他们的重点是增强和/或组合来自多个来源的细节层,而不是压缩整体动态范围。在增强的时候,图像被分为基础层和细节层。原创 2023-06-05 11:47:17 · 501 阅读 · 1 评论 -
【论文阅读笔记】Contrast image correction method
在图像处理领域,已经有几种调整图像对比度的方法。通常,可以将这些算法分为两类对比度校正:全局校正和局部校正。当必须同时调整阴影和高光细节时,全局对比度校正可能会产生令人失望的结果。另一方面,局部对比度校正的优点是它们提供了一种将一个输入值映射到许多不同输出值的方法,这取决于相邻像素的值,并允许以这种方式同时进行阴影和高光调整。在全局对比度增强技术中,ganma校正和直方图均衡化是最常见的。在图像原始灰度分布的基础上,将图像的直方图重塑为不同的具有均匀分布特性的直方图,以增强对比度。原创 2023-05-29 21:11:57 · 697 阅读 · 1 评论 -
【论文阅读笔记】Domain Transform for Edge-Aware Image and Video Processing
本文提出了一种实时对图像和视频执行高质量边缘保留过滤的方法,主要是通过基于距离的1D卷积核来完成2D卷积的操作,这也是对称卷积中较为常用的加速方式。但这里不同的地方在于,它不是对称卷积,两个1D卷积核都是基于邻间像素距离来实现自适应边缘保留滤波。本文的域变换和边缘保留滤波可以实现多种功能,包括边缘保留过滤、景深效果、风格化、重新着色、着色、细节增强和色调映射。本文实现了三种边缘保留的一维卷积:基于归一化的卷积,插值卷积和递归方式的卷积。这些滤波器都有非常明显的脉冲响应,使得每一个都有更适合其特定的应用。原创 2023-03-30 20:30:39 · 627 阅读 · 2 评论 -
【论文阅读笔记】Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs
RepLKNet原创 2022-07-20 11:03:27 · 1516 阅读 · 0 评论 -
【论文阅读笔记】NITRE 2022 Challenge on Efficient Super-Resolution: Methods and Results
ESR竞赛原创 2022-06-30 15:17:41 · 2949 阅读 · 2 评论 -
【论文阅读笔记】Real-Time Video Super-Resolution on Smartphones with Deep Learning, Mobile AI 2021 Challenge
论文地址:https://arxiv.org/abs/2105.08826论文小结 这比赛的目标是在移动手机上得到实时运行的视频超分算法,目标在480p(实际上是180∗30180*30180∗30)分辨率输入下得到HD分辨率,且有80FPS。训练数据集为REDS,4倍超分,在OPPO Find x2手机上,865的芯片,Qualcomm Adreno 650 CPU,浮点数网络(之前的SISR目标是定点数网络)。 视频超分比赛输入为180∗320180*320180∗320,目标是4倍上采样,图原创 2022-03-16 14:53:02 · 4489 阅读 · 0 评论 -
【论文阅读笔记】Real-Time Quantized Image Super-Resolution on Mobile NPUs,Mobile AI 2021 Challenge: Report
论文地址:https://arxiv.org/abs/2105.07825论文小结 这是2021年的一个移动端超分算法的比赛,其要求的目标平台有只能运行INT8的电视等,所以要求模型是全量化的。模型算法的目标是3倍超分,到1080P分辨率,即640∗360640*360640∗360到1920∗10801920*10801920∗1080,目标时间是404040-606060ms之内完成。模型的运行时间是在Synaptics VS680 Smart Home board with a dedicate原创 2022-03-04 15:05:54 · 3823 阅读 · 0 评论 -
【论文阅读笔记】Extremely Lightweight Quantization Robust Real-Time Single-Image Super Resolution for Mobile
论文地址:https://arxiv.org/abs/2105.10288代码地址:https://github.com/cxzhou95/XLSR论文小结 本文的方法名为 XLSR ,名义上获得了2021年Mobile AI SISR比赛的冠军。该比赛目标是移动平台,模型的所有参数和推理都需要是INT8量化的,所以该比赛下的论文模型都是INT8量化的。总得来说,论文所做基本可分为两点:(1)选择一个合适的基础框架模块;(2)为SR模型的输出添加一个Clip ReLU模块;原创 2022-02-23 18:27:08 · 968 阅读 · 0 评论 -
【论文阅读笔记】Lightweight Image Super-Resolution with Enhanced CNN
论文地址:https://arxiv.org/abs/2007.04344代码地址:https://github.com/hellloxiaotian/LESRCNN)论文小结 本文的模型名字叫做 LESRCNN ,为lightweight enchanced SR CNN。目标与名字一样,想弄一个轻量级可以在端上推理的模型。作者的设备为 I7-7800 和 1080Ti,内存大小为16G,推理时长如下图所示。模型主体有23层卷积层,卷积核为3∗33*33∗3和1∗11*11∗1交替进行,看起来不小原创 2022-02-16 15:26:22 · 3178 阅读 · 0 评论 -
【论文阅读笔记】Real-Time High-Resolution Background Matting
论文地址:https://arxiv.org/abs/2012.07810代码地址:https://github.com/PeterL1n/BackgroundMattingV2论文小结 本文的方法名为BGMv2,其前身为Background Matting: The World Is Your Green Screen(512*512分辨率下达到8fps)是一个不需要Trimap的Matting方法。本系列的方法,需要提供一个背景图片,但不需要完全精确对齐的背景。前文提供了一个效果较好的提升模型,原创 2021-09-23 17:31:42 · 2162 阅读 · 1 评论 -
【论文阅读笔记】Image Inpainting for Irregular Holes Using Partial Convolutions
论文地址:https://arxiv.org/abs/1804.07723论文小结 本文提出一种图像修复的方法,其使用Partial Convolution,可以实现当时最先进的图像修复效果(1804)。本文的模型可以稳健地处理任何形状、大小、位置和距离图像边界的Holes。而且本文的方法性能不会随着孔洞的增大而急剧恶化。 之前的方法,mask中的holes在图像中的表示是使用替代值,通常是使用均值。这对于卷积而言是无法区分是否是人工信息的,且以前的方法通常解决的对象都是mask为矩形的。本文使用原创 2021-08-24 19:57:59 · 3693 阅读 · 5 评论 -
【论文阅读笔记】Partial Convolution based Padding
论文地址:https://arxiv.org/abs/1811.11718代码地址:https://github.com/NVIDIA/partialconv论文小结 本文提出一种有效地解决因padding造成的无效信息增加的方案。 本文提出的解决方案借鉴于partial convolution的思想,以此一起解决padding造成的问题,可以在边界处得到更有效的检测,可以得到比zero-padding要好的结果(在分类和语义分割问题上有验证)。 直观上来说,partial convolut原创 2021-08-23 21:22:51 · 2083 阅读 · 0 评论 -
【论文阅读笔记】One Shot 3D Photography
论文主页:https://facebookresearch.github.io/one_shot_3d_photography/代码地址:https://github.com/facebookresearch/one_shot_3d_photography 该3D照片方向,由于刚入门,所以会倾向于翻译文章。每个操作上的选择,及为什么不进行另外操作的原因都如数放上。论文小结 本作的工作是从单张RGB图片生成一个移动视角的3D照片。 其管道大致如下:由RGB图像通过单目深度估计网络估计深度图原创 2021-08-20 19:39:31 · 1014 阅读 · 0 评论 -
【论文阅读笔记】Rethinking the Heatmap Regression for Bottom-up Human Pose Estimation
论文地址:https://arxiv.org/abs/2012.15175代码地址:https://github.com/greatlog/SWAHR-HumanPose论文总结 本文所针对的问题,是Bottom-up方法中的不同对象尺度会造成的问题。同一张图的不同尺度对象所对应的感受野不同,因此也应该有不同kernel size的高斯核heatmap。所以对于bottom-up方法,尺度适应的heatmap回归方法自适应每个keypoint的标准差,与此同时,提出自适应权重heatmap回归的损失原创 2021-04-19 20:15:08 · 2829 阅读 · 0 评论 -
【论文阅读笔记】Simple and Lightweight Human Pose Estimation
论文地址:https://arxiv.org/abs/1911.10346代码地址:https://github.com/zhang943/lpn-pytorch论文总结 本文网络名叫LPN。本文的核心目的,其实也就是实现轻量级的姿态检测网络。其做法方式也相对比较传统和简单,实际上就是对backbone进行轻量级设计。网络架构如下图所示:在Downsample的部分,样式和ResNet-18是一样的,但实际上采用的是ResNet-50的结构(bottleneck block),只是将expansio原创 2021-03-11 15:19:03 · 1402 阅读 · 0 评论 -
【论文阅读笔记】HarDNet: A Low Memory Traffic Network
论文地址:https://arxiv.org/abs/1909.00948论文总结 HarDNet,是Harmonic Densely Connected Network,可以看做是简化版的DenseNet,通过一定的规则使得ShortCut连接稀疏化,如下图所示。 作者提出了一个新的指标 CIO,其简单地定义为每个卷积层的输入输出tensor size和,CIO=∑(cinl∗winl∗hinl+coutl)∗woutl∗houtl)CIO=\sum(c_{in}^l*w_{in}^l*h原创 2021-03-08 19:54:48 · 1396 阅读 · 0 评论 -
【论文阅读笔记】CSPNet:A New Backbone that can Enhance Learning Capability of CNN
论文地址:https://arxiv.org/abs/1911.11929代码地址:https://github.com/WongKinYiu/CrossStagePartialNetworks.论文总结 本文的目的旨在优化之前含有ShortCut结构的网络,比如DenseNet和ResNet。其围绕的中心思想是网络优化中的重复梯度信息,以此来优化之前网络中所需要的大量推理计算问题。最后,优化的网络结构在ImageNet和MS COCO上都有好的结果。因此可以初步认为具有足够的泛化能力。论文介绍原创 2021-03-05 17:57:21 · 2975 阅读 · 1 评论 -
【论文阅读笔记】Occlusion-Aware Siamese Network for Human Pose Estimation
论文地址:Occlusion-Aware Siamese Network for Human Pose Estimation论文总结 本文的网络名,作者命名为OASNet。本文的出发点就如名字所说的一般,设计方法的思路是朝着姿态检测中遮挡问题做的。其主要做法就是通过人工制作遮挡,使用attention机制将遮挡部分的信息擦除,然后使用领域信息重构回丢失的有用信息,这部分也就是信息擦除和重构模块。这个attention分支得到的东西是通过中间监督来保证遮挡部分的信息擦除。 特征重构部分是想要将特征擦原创 2021-02-24 12:10:50 · 1462 阅读 · 4 评论 -
【论文阅读笔记】Learning Data Augmentation Strategies for Object Detection
论文地址:https://arxiv.org/abs/1906.11172论文总结 本文是19年关于目标检测数据增强的论文,也没有提出啥开创性思想,主要思想就是“目标检测的数据增强应该和分类不一样,要有一些不同的数据增强策略”,然后做了一些实验来验证数据增强的组合。 然后通过搜索,得到了几组数据增强策略。还有就是,可以在小数据集上进行策略的应用,该策略在大数据集上也能有足够的泛化效应。 作者的贡献主要在搜索方法上,通过强化学习等工具,离散优化搜索策略空间。 学习到的5个子策略,如下图所示:原创 2021-02-04 20:20:50 · 400 阅读 · 1 评论 -
【论文阅读笔记】Associative Embedding:End-to-End Learning for Joint Detection and Grouping
论文地址:https://arxiv.org/abs/1611.05424论文总结 这是16年的老论文了,该方法可以产生pixel-wise的预测,得到检测结果和grouping,所以理论上可以适用于任何pixel-wise的任务,比如多人姿态检测、实力分割等。 在姿态检测任务上,除了传统的heatmap预测,还有一个grouping分支,用来预测一组数字,数字接近的为同一个目标。数字的本身并不重要,重要的是用来相互区分的意义。论文介绍 模型预测两个分支,一个是pixel detection原创 2021-02-02 19:32:52 · 472 阅读 · 0 评论 -
【论文阅读笔记】An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modelin
论文地址:An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling代码地址:https://github.com/LOCUSLAB/tcn论文总结 本文的方法名为TCN,本文没提出什么新的东西,主要是使用Causal Conv,Dilated Conv和residual block对时序序列进行预测,同时与传统的时序模型LSTM等循环和递归网络结构进行对比。然后在多个不同原创 2021-01-29 12:10:50 · 998 阅读 · 0 评论 -
【论文阅读笔记】Cascade Feature Aggregation for Human Pose Estimation
论文地址:https://arxiv.org/abs/1902.07837论文总结 本文的方法名为CFA,大意就是级联特征融合,其论文中的主题思想实际上也是不断对特征的输出进行refine。与很多直接将网络进行串联或并联的方法类似,文中将多个网络进行了连接。比较不同的一点就在于这个连接上,其上一个网络结构传入下一个网络结构的输入一共有三个:某个blocks的输出,网络结构的输出,以及该网络结构上heatmap的预测,在经过处理(卷积到相同的channel)后将三者进行element-add操作。连接结原创 2021-01-25 11:02:11 · 594 阅读 · 0 评论 -
【论文阅读笔记】Deep High-Resolution Representation Learning for Human Pose Estimation
论文地址:https://arxiv.org/abs/1902.09212代码地址:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch论文总结 论文总得来说是提出了一种网络架构的思想:以前的模型都是下采样后再上采样,从而达到预期的分辨率。而本文的网络HRNet则一直维持高分辨率分支,通过融合低分辨率分支上采样带来的high level信息,达到重复多尺度信息的融合。网络结构入下图所示:由一个高分辨率的子网开始,后面逐渐维持多个原创 2021-01-14 15:31:13 · 1254 阅读 · 0 评论 -
【论文阅读笔记】AID: Pushing the Performance Boundary of Human Pose Estimation with Information Dropping Aug
论文地址:AID: Pushing the Performance Boundary of Human Pose Estimationwith Information Dropping Augmentation论文总结原创 2021-01-14 11:35:57 · 1008 阅读 · 2 评论 -
【论文阅读笔记】Stacked HOurglass Networks for Human Pose Estimation
论文地址:https://arxiv.org/abs/1603.06937论文总结 本文方法名为Hourglass,是16年的老论文了。其论文中的思想,主要是发现了重复的上采样和下采样这种结构(重复的encoder-decoder)的重要性,而且在模型训练的时候添加中间监督,其认为这两点很重要。论文结构入下图所示,每一个“沙漏”就是一个hourglass,多个就是stacked hourglass论文介绍Hourglass 设计 重复编解码的灵感是来自于作者认为:识别脸和手是需要局部信原创 2021-01-12 15:32:18 · 678 阅读 · 0 评论 -
【论文阅读笔记】UniPose: Unified Human Pose Estimation in Single Images and Videos
论文地址:https://arxiv.org/abs/2001.08095论文总结 本文比较不同的地方就是将ASPP(Atrous Spatial Pyramid Pooling)应用在了pose检测中,通过并行化的不同空洞率的空洞率扩大感受野,最终下采样只在stride=8的地方开始上采样。虽然下采样最大只到了8,但只是ResNet101后两个blocks中的stride=1,这并没有减少卷积的操作,也没有增加运算量(虽然feature map变大了,但channel变少了)在论文展示的网络中,上采原创 2021-01-12 11:20:37 · 623 阅读 · 0 评论 -
【论文阅读笔记】Multi-Scale Structure-Aware Network for Human Pose Estimation
论文地址:https://arxiv.org/abs/1803.09894论文总结 本文的主要贡献是提出了一种结构损失的损失函数,将几个物理相连的肢体关键点连接起来,用于人体姿态估计。肢体是我们所认知的人体结构先验,本文将其利用了起来。可以利用身体结构先验,从可见关键点得到不可见关键点的线索。 本论文的改进了目前的深层conv-deconv的 hourglass 模型,有四点改进:(1)多尺度监督想法的实践,通过结合跨尺度的特征heatmaps来加强身体关键点的上下文信息;(2)多尺度回归网络,对原创 2020-12-29 21:53:41 · 491 阅读 · 2 评论 -
【论文阅读笔记】Temporal Keypoint Matching and Refinement Network for Pose Estimation and Tracking
论文地址:http://web.cs.ucla.edu/~zhou.ren/ECCV2020_poseTracking.pdf论文总结 本文实际上就是在top-down结构的基础下,在姿态检测器的backbone上增加了两个模块:时序关键点匹配模块(用以联系两帧之间的实例,维系ID的存在)和时序校正模块(用多帧的姿态检测器产生的heatmap,来加权平均当前的heatmap,从而避免错误的局部最小值响应过大的问题)。两个模块都整合到了单人的姿态检测网络中,训练的时候分两步训练,先训练正常的backbo原创 2020-12-18 12:12:21 · 498 阅读 · 0 评论 -
【论文阅读笔记】3D human pose estimation in video with temporal convolutions and semi-supervised training
论文地址:3D human pose estimation in video with temporal convolutions and semi-supervised training代码地址:VideoPose3D论文总结 本文方法名为VideoPose3D,使用2D关键点序列(xi,yix_i, y_ixi,yi)预测某个时间点的3D关键点,大致就是使用一段2D序列动作去拟合某个带深度的点。在训练的时候,本文也提出一种简单但有效的半监督方法去利用没有未标注的视频数据。半监督方法,大致就是原创 2020-12-16 12:36:49 · 3295 阅读 · 0 评论 -
【论文阅读笔记】BlazePose: On-device Real-time Body Pose tracking
论文地址:https://arxiv.org/abs/2006.10204论文总结: 本文的方法能在移动手机的cpu上跑到实时的效果,在pixel2手机上,超过30fps。 BlazePose,其网络结构借鉴了hourglass这样的堆叠网络,其认为encoder-decoder这样的结构能很好地学习。网络结构如下图所示:在经历了一个encoder之后,使用decoder产生heatmap和offset预测分支进行监督,再通过一个encoder进行坐标回归。在训练的时候,使用heatmap和坐标回原创 2020-12-15 20:32:06 · 4148 阅读 · 0 评论 -
【论文阅读笔记】Integral Human Pose Regression
论文地址:https://arxiv.org/abs/1711.08229代码地址:https://github.com/JimmySuen/integral-human-pose论文总结 本文并没有提出什么新的东西,但做了大量的实验,主要是关于通过网络生成关节坐标,而不是heatmap,证明了产生关节坐标的重要性。其做法与DSNT没啥区别,都是对heatmap使用softmax归一化,然后进行概率积分的回归。 比较特别的一点,是将3D和2D进行联合训练。本文的集成回归方法,也改善了3D姿态估原创 2020-12-15 10:12:34 · 2214 阅读 · 0 评论 -
【论文阅读笔记】ZeroQ: A Novel Zero Shot Quantization Framework
论文地址:ZeroQ论文地址:https://github.com/amirgholami/ZeroQ论文总结 本文的方法是一种后量化方法,是不用finetune的一种方法。 本文的贡献主要有两点:(1)提出了一种方法,从模型的分析中生成更为接近训练数据的数据,用于得到activation的范围和计算每一层的量化损失。(作者称他生成数据的方式,叫做蒸馏,distilled,数据)(2)提出使用Pareto frontier方法去选择目标模型大小的一个混合精度。 本文的混合精度的选择,是在目标原创 2020-12-10 21:56:07 · 1697 阅读 · 2 评论 -
【论文阅读笔记】Estimating Human Pose from Occluded Images
论文地址:Estimating Human Pose from Occluded Images论文总结: 本文是3D姿态检测的方法。其从图片中直接回归3D关节点的位置。之前未解决的问题是如何估计一个被部分/眼中这单个的人的3D姿态。 本文中,作者提出一个方法解决遮挡问题:利用稀疏信号表示,这样测试的样本可以被看做是训练样本的紧凑线性表示。稀疏解可以通过一些确定的正则项(比如L1L_1L1)求解凸优化获得。通过对未遮挡训练图片的线性组合,可正确恢复被遮挡(破坏)的测试图片。然后将其用于正确地估计被原创 2020-12-09 10:28:08 · 172 阅读 · 0 评论 -
【论文阅读笔记】Camera Distance-aware Top-down Approach for 3D Multi-person Pose Estimation from Single RGB
论文地址:Camera Distance-aware Top-down Approach for 3D Multi-person PoseEstimation from a Single RGB Image代码地址:RootNet_3D,PoseNet_3D论文总结 本文的方法,是在一张图片上预测两个目标:(1)3D人体位置的根节点定位;(2)相对根节点的单人3D姿态估计。和很多方法不同的是,本文在两者的实验中进行了探索,最终决定采用两个网络进行分别训练,而不是单独训练。本文的方法是多人3D姿态检原创 2020-12-08 22:17:38 · 2034 阅读 · 1 评论 -
【论文阅读笔记】Numerical Coordinate Regression with Convolutional Neural Networks
论文地址:Numerical Coordinate Regression with Convolutional Neural Networks代码地址:https://github.com/anibali/dsntnn论文总结 本文提供了一种从图像中直接学习到坐标的一种思路。现在主流的方法都是基于高斯核处理的heatmap作为监督,但这种方法学习到的heatmap,在后处理得到坐标的过程中,存在量化误差(比如4倍下采样的heatmap,量化误差的期望是2)。 本文提出一种新的处理方法,称为DSN原创 2020-12-07 16:52:42 · 2739 阅读 · 3 评论 -
【论文阅读笔记】GhostNet:More Features from Cheap Operations
论文地址:https://arxiv.org/abs/2010.14819代码地址:https://github.com/huawei-noah/ghostnet论文总结 本文提出一种模块,可以用来直接替换平常的卷积层,叫做 Ghost Module,可以用作即插即用的组件。由 Ghost Module 直接构建的网络叫做 GhostNet(网络结构和 MobileNetv3一样,只是组件不一样)。网络的分类效果比同计算量的 MobileNetv3要好一些。 Ghost Module 如下图所示原创 2020-11-30 21:40:42 · 267 阅读 · 0 评论 -
【论文阅读笔记】Simple Baselines for Human Pose Estimation and Tracking
论文地址:Simple Baselines for Human Pose Estimation and Tracking代码地址:https://github.com/leoxiaobin/pose.pytorch论文总结 本文的方法和内容如文章名一般,是为了提供一个人体姿态检测和跟踪的Baseline,且易于实现。本文在网络结构上没有多的花哨的思想,只是在backbone后添加了几个deconv层,没有skip connection传递特征。通过实验得到对应的超参数。在论文实验上,也没有中间监督原创 2020-11-25 16:22:16 · 1721 阅读 · 0 评论 -
【论文阅读笔记】Towards Accurate Multi-person Pose Estimation in the Wild
论文地址:https://arxiv.org/abs/1701.01779论文总结 本文是top-down的姿态检测模型,其人体检测器采用Faster RCNN,Faster RCNN 以 ResNet-101 姿态检测器以Res101作为backbone,预测两个分支:Heamtap(KKK个channel)和Offset(2∗K2*K2∗K个channel)。同时,在对人体检测器采用的 NMS 方案,作者提出了一种新的 NMS 方案:使用0.60.60.6的 IoU 阈值执行 NMS,过滤掉过于原创 2020-10-14 15:31:16 · 970 阅读 · 0 评论 -
【论文阅读笔记】How Robust is 3D Human Pose Estimation to Occlusion?
论文地址:https://arxiv.org/abs/1808.09316论文总结 本文主要在生成遮挡策略的方向上进行实验,得到实验结果和对比。但由于当时的精度不是特别高,所以其中的一些结论现如今不一定完全适用。 实验了几种策略,单个矩形框、多个矩形框、多个条状、多个圆形、VOC对象嵌入等方式,如下图所示。 论文的结论是,VOC的嵌入式遮挡策略,对于多重遮挡情况的泛化能力较好。论文介绍 本文自己实现了一个全卷积网络,预测3D的heatmap,目标是图片空间的x,y以及相对根节原创 2020-10-12 18:09:33 · 287 阅读 · 0 评论