计算机视觉
文章平均质量分 75
乐乐lelele
既然选择了远方,便只顾风雨兼程
展开
-
【姿态估计】PCK(Percentage of Correct Keypoints)指标及代码实现
姿态估计评价指标PCK原创 2022-06-23 22:39:36 · 4511 阅读 · 1 评论 -
自监督学习(Self-supervised Learning)
自监督学习(Self-supervised learning)是这两年比较热门的一个研究领域,它旨在对于无标签数据,通过设计辅助任务(Proxy tasks)来挖掘数据自身的表征特性作为监督信息,来提升模型的特征提取能力原创 2021-12-08 10:21:16 · 50081 阅读 · 0 评论 -
浅谈知识蒸馏(Knowledge Distillation)
前言:在实验室做算法研究时,我们最看重的一般是模型精度,因为精度是我们模型有效性的最直接证明。而在公司做研发时,除了算法精度,我们还很关注模型的大小和内存占用。因为实验室模型一般运行在服务器上,很少有运算资源不足的情况,但是公司研发的算法功能最终都是要部署到实际的产品上的,像手机或者小型计算平台,其运算资源是很有限的。所以算法工程师在公司做预研时,算法建模一般都分两部分:先根据需求建模,并尽可能提高模型精度;然后进行模型压缩,在保证算法精度的情况下尽可能减少其参数量。常用的模型压缩方法: 知识蒸馏、权重原创 2021-12-09 12:49:46 · 1914 阅读 · 1 评论 -
基于主成分分析(PCA)实现人脸识别(Eigenface原理)
基于主成分分析(PCA)实现人脸识别(Eigenface)原创 2021-12-08 10:34:42 · 6322 阅读 · 1 评论 -
【论文阅读-姿态估计】Differentiable Hierarchical Graph Grouping for Multi-Person Pose Estimation
本文将介绍一篇基于图模型的多人姿态估计方法,作者来自香港大学、商汤科技、南京大学和悉尼大学。论文链接: https://arxiv.org/abs/2007.11864v1代码链接: 尚未公开主要思想:现有的多人姿态估计模型一般分为一般分为两大类:top-down和bottom-up方法。Top-down的模型先对输入的图像进行目标检测,检测出图像中每个人的bounding box之后,通过单人姿态估计模型对每个人的姿态进行检测。而bottom-up的方法则是先通过关键点检测模型检测出图像中所有人原创 2021-06-26 18:18:20 · 654 阅读 · 0 评论 -
【论文阅读-姿态估计】CVPR2021_CanonPose: Self-Supervised Monocular 3D Human Pose Estimation in the Wild
本文将介绍一篇基于自监督的3D人体姿态估计方法,作者来自德国汉诺威大学和加拿大英属哥伦比亚大学。论文链接:https://arxiv.org/abs/2011.14679代码链接: 尚未公开主要思想:本文提出了一个利用多视角2D图像估计3D人体姿态的模型,主要框架如下图所示。首先将同一姿态不同视角下的图像分别输入两个共享权重的Lifting网络,这部分网络输出为两个分支,一个分支输出标准坐标下的3D姿态(outputs a 3D pose in a canonical rotation),另一个分原创 2021-03-22 21:17:19 · 1781 阅读 · 4 评论 -
【论文阅读-姿态估计】ECCV2020_Unsupervised 3D Human Pose Representation with Viewpoint and Pose Disentanglemen
本文将介绍一种基于特征分离的无监督姿态特征学习模型,作者来自香港中文大学论文链接:https://arxiv.org/abs/2007.07053代码链接:https://github.com/NIEQiang001/unsupervised-human-pose主要思想:图1 本文提出的模型结构【参考文献】:[1] 迁移性好、多用途,港中文提出特征分离的无监督人类三维姿态表征...原创 2020-12-15 10:56:17 · 435 阅读 · 0 评论 -
【论文阅读-姿态估计】 CVPR2019_Deep High-Resolution Representation Learning for Human Pose Estimation
【论文阅读】 Deep High-Resolution Representation Learning for Human Pose Estimation_CVPR2019作者来自中科大和微软亚洲研究院论文链接:Deep High-Resolution Representation Learning for Human Pose Estimation_CVPR2019代码链接:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch原创 2020-12-10 20:11:55 · 281 阅读 · 0 评论 -
【python】读取 .npy文件并存储为图像格式(代码)
深度网络时常会将数据集中的图像打包“.npy”格式来处理,有时候为了输出也会是该格式,所以我们需要将其读入并转化为图像格式。“.npy”文件是将数据集中的若干图像某一维度上叠加而来,我们可据此读取原图,python代码如下:#by hanlestudy@163.comimport numpy as npimport scipy.miscimgs_test = np.load('./pat...原创 2019-04-28 15:32:56 · 17549 阅读 · 13 评论 -
Attention Model 及其发展现状概述
视觉注意力是人类视觉信息处理过程中一项重要的调节机制,在视觉注意力的引导下,人类能够从众多的视觉信息中快速地选择那些最重要、最有用、与当前行为最相关的感兴趣的视觉信息。当人类观赏一幅画时,虽然我们可以看到整幅画的全貌,但是在我们深入仔细地观察时,其实眼睛仅聚焦在很小的一块区域,这个时候人的大脑主要关注在这一小块图案上,因此人脑对整幅图的关注并不是均衡的,具有一定的权重区分。而注意力模型(Attention model)就是对人脑的注意力模型进行模拟,旨在从众多信息中选择出对当前任务更关键的信息。考虑到人原创 2018-10-23 11:25:13 · 4822 阅读 · 1 评论 -
【显著性目标检测】CVPR2018 显著性检测领域论文整理解读(Salient Object Detection)
前言:CVPR2018会议论文集已经公示(CVPR2018全部论文集链接),本文对显著性目标检测领域的6篇进行了整理,将这几篇论文的主体思想汇总起来,供大家一起学习。一、论文列表:1.《Flow Guided Recurrent Neural Encoder for Video Salient Object Detection》; 2.《A Bi-Directional Message ...原创 2018-07-04 17:02:57 · 18926 阅读 · 11 评论