Pytorch
文章平均质量分 83
Jiliang.Li
太懒,懒得介绍
展开
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集原创 2023-04-11 13:19:53 · 3923 阅读 · 1 评论 -
Darknet53网络结构图及代码实现
Darknet是最经典的一个深层网络,结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题,主要有Darknet19和Darknet53,当然,如果你觉得这还不够深,在你条件允许的情况下你也可以延伸到99,199,999,…。导入包:1、先封装CBL模块:conv bn lrelu装一块2、利用cbl封装一个残差单元yolov3原创 2020-03-14 12:48:58 · 28980 阅读 · 5 评论 -
NanoDet目标检测新网络!比YOLO跑的还快
NanoDet目标检测新网络!比YOLO跑的还快项目链接:https://github.com/RangiLyu/nanodet 作者:RangiLyu NanoDet Super fast and lightweight anchor-free object detection model. Real-time on mobile devices. ⚡Super lightweight: Model file is only 1.8 mb. ⚡Super fast: 97fps(10.原创 2020-11-24 16:17:30 · 1125 阅读 · 0 评论 -
CVPR2017 | ImageNet冠军模型SE-Net详解
原标题:CVPR2017 | ImageNet冠军模型SE-Net详解! 我是Momenta高级研发工程师胡杰,很高兴可以和大家分享我们的SENet。借助我们提出 SENet,我们团队(WMW)以极大的优势获得了最后一届ImageNet 2017竞赛 Image Classification任务的冠军,并被邀请在CVPR 2017的workshop(Beyond ImageNet)中给出算法介绍。下面我将介绍我们提出的SENet,论文和代码会在...原创 2020-11-16 10:53:29 · 645 阅读 · 0 评论 -
CVPR 2020 论文大盘点-动作识别篇
CVPR 2020 论文大盘点-动作识别篇 本文盘点所有CVPR 2020 动作识别(Action Recognition )相关论文,该方向也常被称为视频分类(Video Classification )。从后面的名字可以看出该任务就是对含人体动作的视频进行分类。 (关于动作检测、分割、活动识别等方向将在后续文章整理) 该部分既包含基于普通视频的动作识别,也包含基于深度图和基于骨架的动作识别。 因为视频既包含空域信息,又包含时域信息,所以时空信息的融合、特征提取是该领原创 2020-11-09 16:21:39 · 860 阅读 · 0 评论 -
多任务自适应损失权重
多任务自适应损失权重在训练多任务的时候,当不同任务的数据量不平衡、各任务难易程度不同等等情况下,会导致不同任务的损失差异较大,导致:有些任务学的过快,有些任务学的过慢;简单的任务都已经过拟合了,困难的任务才开始有效果等等结果。这时候,我们有必要干涉一下不同任务的优化力度,如:给不同任务设置超参,通过超参平衡不同任务的。eg:先给困难任务分配一个较大权重,简单任务分配一个较小权重,已使困难样本优化的更快,当困难任务和简单任务差不多平衡后再把两个的权重调整到平衡。但这样有一个问题就是来回修改超参,繁原创 2020-07-21 13:38:37 · 6786 阅读 · 3 评论 -
SSR——NET解读笔记
SSR——NET解读笔记原文地址:源码地址:英文有限,于是我用机器大致翻译了一下,因为是机翻,所以很多地方翻译有问题,不过相信大家做过相关工作或相关研究的都能看出哪里有问题,并能正确理解。里面的原理在看懂论文里的模型结构图,然后自己把模型图重新组织一下,很容易就复现了,实现起来也很简单。下面是我重塑的模型结构图:根据这个图计算出3个δ、ρ和η,然后就可以计算出最终预测结果了。...原创 2020-06-23 10:35:07 · 1351 阅读 · 1 评论 -
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition、SPP-Net、空间金字塔池化
空间金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition、SPP-Net、空间金字塔池化一、相关理论 本篇博文主要讲解大神何凯明2014年的paper:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》,这篇paper主要的创新点在于提出了空间金字塔池化原创 2020-06-03 11:57:30 · 367 阅读 · 0 评论 -
清华大学张长水教授:神经网络模型的结构优化
清华大学张长水教授:神经网络模型的结构优化转自搜狐:▼▼▼▼点击下方原标题跳转至原文原标题:清华大学张长水教授:神经网络模型的结构优化(附PPT) 张长水教授,清华大学自动化系教授、博士生导师,智能技术与系统国家重点实验室学术委员会委员,智能技术与系统国家重点实验室副主任。主要从事机器学习、模式识别、人工智能、计算机视觉等领域的教学和科研工作。 以下是根据张长水教授现场分享整理的文字...原创 2020-04-23 09:32:56 · 2642 阅读 · 0 评论 -
人脸识别、活体检测、人脸识别面临的挑战
人脸识别、活体检测、人脸识别面临的挑战▶▶▶人脸识别面临的三大主要挑战▶▶▶几种成熟、广泛的人脸活体检测方法▶▶▶几种活体检测方法的效果、用户体验及其他方面的对比▶▶▶几种公开的人脸活体检测数据集(这都是些比较老的数据集,较新的等后面收集到再补充)...原创 2020-04-22 23:00:26 · 1541 阅读 · 0 评论 -
人脸识别中的活体检测
人脸识别中的活体检测转自博客:人脸识别中的活体检测看到这篇关于活体检测的文章,于是转载过来了早在指纹识别应用中就有针对于活体手指的检测技术,即使机器只对真人活体指纹产生识别反应,对其他一切物质不作识别,用于指纹识别产品如考勤机、门禁系统等。活体指纹识别的原理比较简单:如识别皮肤的温度、人体皮肤的电容值等。本文主要是针对人脸识别应用中出现的人脸活体检测做简要调研及论述。有关人脸检...转载 2020-04-22 21:47:31 · 7647 阅读 · 0 评论 -
多类别多目标检测YOLOv3网络结构图(注:只是网络结构图,勿喷)
多类别多目标检测YOLOv3网络框架:DarkNet53特征提取器+后面侦测网络原创 2020-04-01 14:16:57 · 2578 阅读 · 0 评论 -
深度神经网络模型剪枝
深度神经网络模型剪枝 神经网络剪枝 Neural Network Pruning原创 2020-04-20 23:43:13 · 2878 阅读 · 1 评论 -
“LSTM的参数解释,LSTM
LSTM的参数解释LSTM总共有7个参数:前面3个是必须输入的1:input_size: 输入特征维数,即每一行输入元素的个数。输入是一维向量。如:[1,2,3,4,5,6,7,8,9],input_size 就是92:hidden_size: 隐藏层状态的维数,即隐藏层节点的个数,这个和单层感知器的结...原创 2020-04-20 07:40:16 · 47457 阅读 · 4 评论