Deep High-Resolution Representation Learning for Human Pose Estimation论文笔记

[论文阅读]HRNetV1,HRNetV2,HRNetV2p_gefeng1209的博客-CSDN博客1.Deep High-Resolution Representation Learning for Human Pose Estimation(HRNetV1)2.High-Resolution Representations for Labeling Pixels and Regions(HRNetV2,HRNetV2p)1.Introduction人体姿势估计(又称关键点检测)旨...https://blog.csdn.net/gefeng1209/article/details/93142916?ops_request_misc=&request_id=&biz_id=102&utm_term=HRNet&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-93142916.pc_column&spm=1018.2226.3001.4449HRNet的网络结构---非常详细_枫呱呱的博客-CSDN博客_hrnet网络结构这是HRNet的官方代码:https://github.com/HRNet更改它的输出头,就可以变成分类、目标检测、分割、姿态检测等网络我是按照以下代码画的网络结构https://github.com/stefanopini/simple-HRNet/blob/master/models/hrnet.py...https://blog.csdn.net/qq_35275007/article/details/115750787?spm=1001.2101.3001.6650.3&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-3.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-3.no_search_linkDeep High Resolution Net(HRNet)代码分析及网络架构_m0_37909240的博客-CSDN博客2020/07/01Hey,HRNet之前已经在论文层面做过介绍了,今天我从网络结构的角度和代码层面再给给大家分析一下。1、网络架构图:2、代码分析2.1 ResNet模块虽然很熟悉了,但是还是介绍一下resnet网络的基本模块。如下的左图对应于resnet-18/34使用的基本块,右图是50/101/152所使用的,由于他们都比较深,所以有图相比于左图使用了1x1卷积来降维。(a)conv3x3: 没啥好解释的,将原有的pytorch函数固定卷积和尺寸为3重新封装了一次;.https://blog.csdn.net/m0_37909240/article/details/107071283?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-5.no_search_link&spm=1001.2101.3001.4242.4最近邻插值:

最近邻插值法(nearest_neighbor) - wancy - 博客园最近在学习tensorflow时对于图像的缩放有疑惑,决定重新抽丝剥茧搞懂。在tf.image.resize(image,(256,256),method=0)中,mehod是默认为0,也就是双线性插https://www.cnblogs.com/wancy/p/15068519.html

按照上面几个链接就能很好理解本论文的结构

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度高分辨率表示学习是一种用于视觉识别的技术,旨在从图像中学习到更高质量和更具表达力的特征表示。在传统的视觉识别任务中,如图像分类、目标检测和语义分割,传统的特征表示方法通常提取低级或中级特征,这些特征可能无法有效地捕捉到图像的复杂信息。而深度高分辨率表示学习通过多层神经网络的结构和大规模训练数据来学习更深层次、更富有语义的图像特征。 深度高分辨率表示学习方法通常包含以下几个关键步骤:首先,通过使用深度卷积神经网络(DCNN)架构来学习特征表示。DCNN是一种层次结构复杂、能够从原始像素数据中自动学习特征的神经网络。其次,利用大规模的标注数据进行训练,通过反向传播算法来更新网络的权重和偏置参数,从而最小化预测误差。最后,在训练过程中采用一些优化策略,如数据增强、正则化和优化器选择等,以提高网络的泛化能力和识别性能。 深度高分辨率表示学习在计算机视觉领域有着广泛的应用。一方面,它可以用于图像分类,通过学习到的高质量特征表示,可以在分类任务中获得更高的准确性和鲁棒性。另一方面,它也可以用于目标检测和语义分割任务,通过学习到的特征表示,可以更准确地定位和分割图像中的对象。此外,深度高分辨率表示学习还可以用于识别特定的物体、场景或人脸,从而应用于人脸识别、目标跟踪和智能安防等领域。 总之,深度高分辨率表示学习是一种能够有效提高视觉识别任务准确性和鲁棒性的技术。它通过学习到更深层次、更富有语义的图像特征表示,提供了更强大的图像分析和理解能力,为计算机视觉领域的各种应用提供了重要的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值