![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能、AI
文章平均质量分 85
关于人工智能算法的相关知识总结和分享
Jiliang.Li
太懒,懒得介绍
展开
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集原创 2023-04-11 13:19:53 · 3412 阅读 · 1 评论 -
CLIP论文翻译、Learning Transferable Visual Models From Natural Language Supervision翻译
CLIP论文翻译、Learning Transferable Visual Models From Natural Language Supervision翻译、多模态模型原创 2023-03-28 12:33:20 · 1519 阅读 · 1 评论 -
NanoDet目标检测新网络!比YOLO跑的还快
NanoDet目标检测新网络!比YOLO跑的还快项目链接:https://github.com/RangiLyu/nanodet 作者:RangiLyu NanoDet Super fast and lightweight anchor-free object detection model. Real-time on mobile devices. ⚡Super lightweight: Model file is only 1.8 mb. ⚡Super fast: 97fps(10.原创 2020-11-24 16:17:30 · 1097 阅读 · 0 评论 -
CVPR2017 | ImageNet冠军模型SE-Net详解
原标题:CVPR2017 | ImageNet冠军模型SE-Net详解! 我是Momenta高级研发工程师胡杰,很高兴可以和大家分享我们的SENet。借助我们提出 SENet,我们团队(WMW)以极大的优势获得了最后一届ImageNet 2017竞赛 Image Classification任务的冠军,并被邀请在CVPR 2017的workshop(Beyond ImageNet)中给出算法介绍。下面我将介绍我们提出的SENet,论文和代码会在...原创 2020-11-16 10:53:29 · 623 阅读 · 0 评论 -
CVPR2019 | 论文之行为/动作识别、手势识别、时序动作检测及视频相关
CVPR2019 | 论文之行为/动作识别、手势识别、时序动作检测及视频相关行为/动作识别、手势识别1、An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition中文:《一种用于骨架动作识别的注意增强型图卷积LSTM网络》作者:Chenyang Si, Wentao Chen, Wei Wang, Liang Wang, Tieniu Tan论文链接:https://arx原创 2020-11-11 16:36:06 · 4184 阅读 · 0 评论 -
CVPR 2020 论文大盘点-动作识别篇
CVPR 2020 论文大盘点-动作识别篇 本文盘点所有CVPR 2020 动作识别(Action Recognition )相关论文,该方向也常被称为视频分类(Video Classification )。从后面的名字可以看出该任务就是对含人体动作的视频进行分类。 (关于动作检测、分割、活动识别等方向将在后续文章整理) 该部分既包含基于普通视频的动作识别,也包含基于深度图和基于骨架的动作识别。 因为视频既包含空域信息,又包含时域信息,所以时空信息的融合、特征提取是该领原创 2020-11-09 16:21:39 · 797 阅读 · 0 评论 -
多任务自适应损失权重
多任务自适应损失权重在训练多任务的时候,当不同任务的数据量不平衡、各任务难易程度不同等等情况下,会导致不同任务的损失差异较大,导致:有些任务学的过快,有些任务学的过慢;简单的任务都已经过拟合了,困难的任务才开始有效果等等结果。这时候,我们有必要干涉一下不同任务的优化力度,如:给不同任务设置超参,通过超参平衡不同任务的。eg:先给困难任务分配一个较大权重,简单任务分配一个较小权重,已使困难样本优化的更快,当困难任务和简单任务差不多平衡后再把两个的权重调整到平衡。但这样有一个问题就是来回修改超参,繁原创 2020-07-21 13:38:37 · 6453 阅读 · 3 评论 -
SSR——NET解读笔记
SSR——NET解读笔记原文地址:源码地址:英文有限,于是我用机器大致翻译了一下,因为是机翻,所以很多地方翻译有问题,不过相信大家做过相关工作或相关研究的都能看出哪里有问题,并能正确理解。里面的原理在看懂论文里的模型结构图,然后自己把模型图重新组织一下,很容易就复现了,实现起来也很简单。下面是我重塑的模型结构图:根据这个图计算出3个δ、ρ和η,然后就可以计算出最终预测结果了。...原创 2020-06-23 10:35:07 · 1325 阅读 · 1 评论 -
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition、SPP-Net、空间金字塔池化
空间金字塔池化Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition、SPP-Net、空间金字塔池化一、相关理论 本篇博文主要讲解大神何凯明2014年的paper:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》,这篇paper主要的创新点在于提出了空间金字塔池化原创 2020-06-03 11:57:30 · 349 阅读 · 0 评论 -
多GPU跑神经网络
多GPU跑神经网络链接:https://www.jiqizhixin.com/articles/2018-10-17-11原创 2020-05-20 09:45:39 · 1069 阅读 · 0 评论 -
BN层的主要作用
BN层的主要作用BN层的作用主要有三个:加快网络的训练和收敛的速度控制梯度爆炸防止梯度消失防止过拟合分析:(1)加快收敛速度:在深度神经网络中中,如果每层的数据分布都不一样的话,将会导致网络非常难收敛和训练,而如果把 每层的数据都在转换在均值为零,方差为1 的状态下,这样每层数据的分布都是一样的训练会比较容易收敛。(2)防止梯度爆炸和梯度消失:以sigmoid函数为例,sigmoid函数使得输...原创 2020-04-28 07:49:16 · 7557 阅读 · 0 评论 -
目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD的简单介绍
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD转自:看点快报原文链接:https://kuaibao.qq.com/s/20180723B05TXK00?refer=cp_1026一、目标检测常见算法object detection,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。所以,object detection要解决...原创 2020-04-27 21:35:34 · 866 阅读 · 0 评论 -
清华大学张长水教授:神经网络模型的结构优化
清华大学张长水教授:神经网络模型的结构优化转自搜狐:▼▼▼▼点击下方原标题跳转至原文原标题:清华大学张长水教授:神经网络模型的结构优化(附PPT) 张长水教授,清华大学自动化系教授、博士生导师,智能技术与系统国家重点实验室学术委员会委员,智能技术与系统国家重点实验室副主任。主要从事机器学习、模式识别、人工智能、计算机视觉等领域的教学和科研工作。 以下是根据张长水教授现场分享整理的文字...原创 2020-04-23 09:32:56 · 2599 阅读 · 0 评论 -
人脸识别、活体检测、人脸识别面临的挑战
人脸识别、活体检测、人脸识别面临的挑战▶▶▶人脸识别面临的三大主要挑战▶▶▶几种成熟、广泛的人脸活体检测方法▶▶▶几种活体检测方法的效果、用户体验及其他方面的对比▶▶▶几种公开的人脸活体检测数据集(这都是些比较老的数据集,较新的等后面收集到再补充)...原创 2020-04-22 23:00:26 · 1505 阅读 · 0 评论 -
人脸识别中的活体检测
人脸识别中的活体检测转自博客:人脸识别中的活体检测看到这篇关于活体检测的文章,于是转载过来了早在指纹识别应用中就有针对于活体手指的检测技术,即使机器只对真人活体指纹产生识别反应,对其他一切物质不作识别,用于指纹识别产品如考勤机、门禁系统等。活体指纹识别的原理比较简单:如识别皮肤的温度、人体皮肤的电容值等。本文主要是针对人脸识别应用中出现的人脸活体检测做简要调研及论述。有关人脸检...转载 2020-04-22 21:47:31 · 7498 阅读 · 0 评论 -
深度神经网络模型剪枝
深度神经网络模型剪枝 神经网络剪枝 Neural Network Pruning原创 2020-04-20 23:43:13 · 2833 阅读 · 1 评论 -
“LSTM的参数解释,LSTM
LSTM的参数解释LSTM总共有7个参数:前面3个是必须输入的1:input_size: 输入特征维数,即每一行输入元素的个数。输入是一维向量。如:[1,2,3,4,5,6,7,8,9],input_size 就是92:hidden_size: 隐藏层状态的维数,即隐藏层节点的个数,这个和单层感知器的结...原创 2020-04-20 07:40:16 · 46366 阅读 · 4 评论 -
多类别多目标检测YOLOv3网络结构图(注:只是网络结构图,勿喷)
多类别多目标检测YOLOv3网络框架:DarkNet53特征提取器+后面侦测网络原创 2020-04-01 14:16:57 · 2551 阅读 · 0 评论 -
Python解析Json文件
Python解析Json文件写在前面 在项目开发中,难免会遇到需要解析别人发过来的Json文件或将自己的输出打包成Json发生给别人,(尤其是做算法,50%-70%的工作量都在数据处理,而数据标注文件大多是Json、XML、txt类型),如果你试图直接用记事本或其他编辑器打开Json文件找里面的内容,那恭喜你,你的工作任务将从此刻开始指数级增长,里面密密麻麻都是字符,本文将介绍怎么利用Pyt...原创 2020-03-30 12:25:26 · 2323 阅读 · 0 评论 -
Tools:IOU、NMS、RAdam、one-hot、余弦相似度
Tools:IOU、NMS、RAdam▶IOUdef iou(box, boxes, isMin = False): area = (box[2] - box[0]) * (box[3] - box[1]) # 第一个框和剩下 所有的框比 areas = (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1]) x1 = np...原创 2020-03-30 07:52:19 · 2169 阅读 · 0 评论 -
分类器ArcFace、ArcLoss在MNIST数据集上的实现和效果
分类器ArcFace、ArcLoss在MNIST数据集上的实现和效果写在前面: 前一篇文章(电梯直达)给大家介绍了CenterLoss,本文将带领大家认识一下ArcFace(ArcLoss、Insightface),并在MNIST数据集上实战一下看一下效果。一、原理CenterLoss是将每个类别的特征缩减到他的中心位置,从而间接使不同特征之间界限分明,而ArcLoss则是在原本两个特征...原创 2020-03-24 17:22:24 · 9707 阅读 · 11 评论 -
『MTCNN』2万多字教科书式详解
发现一篇关于MTCNN的博文,本来打算自己写一篇的,但看了这篇,我觉得不用我再写了,转载跟大家分享一下尊重原创,转载自:https://blog.csdn.net/sinat_39783664/article/details/104269314『MTCNN』2万多字教科书式详解本文详细讲解了人工智能深度学习中最经典的神经网络之一:MTCNN。2万多字的内容,主要从理论和实践两方面对M...转载 2020-03-23 11:54:25 · 4352 阅读 · 0 评论 -
CenterLoss在MNIST上的实现
MNIST特征提取解释图像识别之CenterLoss一、提出问题 在图像识别中,一个很关键的要素就是图像中提取出来的特征,它关乎着图像识别的精准度。而通常用的softmax输出函数提取到的特征之间往往接的很紧,无太大的明显界限。在根据这些特征做识别的时候会出现模拟两可的情况,那么怎么让提取到的特征之间差异性更大从...原创 2020-03-19 16:00:33 · 6019 阅读 · 0 评论 -
研发中遇到的问题总结
Python、Pytorch、AI算法、Linux、Windows开发过程中遇到的一些问题及其解决方法(自备的,以便后面遇到同样问题时查阅,如果对你没有帮助,请划走)原创 2020-03-17 21:54:06 · 6081 阅读 · 2 评论 -
神经网络打印模型参数及参数名字和数量
神经网络打印模型参数及参数名字和数量在设计和优化神经网络模型性能时,很多时候需要考虑模型的参数量和计算复杂度,下面一个栗子可以帮助我们快速查看模型的参数。** 举个栗子,如有错误,欢迎大家批评指正 **exp:import torchfrom torch import nnclass Net(nn.Module): def __init__(self): super().__...原创 2019-12-24 21:48:10 · 8185 阅读 · 1 评论 -
人脸识别ArcFace损失函数(代码)
人脸识别ArcFace损失函数class ArcLoss(nn.Module): def __init__(self, class_num, feature_num, s=10, m=0.1): super().__init__() self.class_num = class_num self.feature_num = feature_num self.s = s se...原创 2019-12-22 13:29:39 · 5339 阅读 · 3 评论 -
人脸识别-arcface损失函数
人脸识别-arcface损失函数参考博客:L-margin softmax loss:https://blog.csdn.net/u014380165/article/details/76864572A-softmax loss:https://blog.csdn.net/u011808673/article/details/80491361AM-softmax loss:https://...原创 2019-11-26 20:48:41 · 6914 阅读 · 0 评论 -
神经网络中的梯度爆炸
神经网络中的梯度爆炸一、什么事梯度爆炸?“梯度爆炸指神经网络训练过程中大的误差梯度不断累积,导致模型权重出现重大更新。会造成模型不稳定,无法利用训练数据学习”误差梯度是神经网络训练过程中计算的方向和数量,用于以正确的方向和合适的量更新网络权重。 在深层网络或循环神经网络中,误差梯度可在更新中累积,变成非常大的梯度,然后导致网络权重的大幅更新,并因此使网络变得不稳定。在极端情况下,权重的值变得...原创 2019-12-28 14:25:22 · 4635 阅读 · 0 评论 -
长短期记忆网络LSTM识别验证码、车牌识别
长短期记忆网络LSTM-Seq2Seq识别验证码使用LSTM结合Seq2Seq结构实现验证码识别验证码样式如下图:代码生成42000张验证码(train:40000, test:2000),验证码有清晰的,有低度模糊的,也有中度模糊的,位置也随机。验证码和标签采用DataLoader加载,标签采用4*10的one-hot编码,网络输出每个图片也是4*10,训练30轮即达到了正确率100%...原创 2019-12-28 14:59:54 · 5888 阅读 · 2 评论 -
Darknet53网络结构图及代码实现
Darknet是最经典的一个深层网络,结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题,主要有Darknet19和Darknet53,当然,如果你觉得这还不够深,在你条件允许的情况下你也可以延伸到99,199,999,…。导入包:1、先封装CBL模块:conv bn lrelu装一块2、利用cbl封装一个残差单元yolov3原创 2020-03-14 12:48:58 · 28730 阅读 · 5 评论 -
神经网络同时优化两个模型的参数/加载两个模型的参数
神经网络同时优化两个模型的参数/加载两个模型的参数以Adam为例一、传参和优化1、传入/优化一个模型的参数:opt= torch.optim.Adam(model_1.parameters)2、同时传入/优化两个模型的参数:opt = torch.optim.Adam([ {'params': model_1.parameters()}, {'params': model_2....原创 2019-12-29 21:29:57 · 15310 阅读 · 3 评论