人工智能
文章平均质量分 62
人工智能
AI浩
2022年博客之星Top8,2021年博客之星Top6,博客专家,华为云云享专家,十佳博主,阿里云专家博主,拥有多项发明专利并参与过国家重大专项,拥有丰富的开发经验。注重理论与实践的结合,让AI学起来不再枯燥。如果大家在看文章的时候,发现了文章的错误,烦请指出,我会及时纠正。
展开
-
MogaNet实战:使用 MogaNet实现图像分类任务(二)
训练部分。原创 2024-02-13 09:01:25 · 1804 阅读 · 5 评论 -
MogaNet实战:使用MogaNet实现图像分类任务(一)
论文:https://arxiv.org/pdf/2211.03295.pdf作者多阶博弈论交互这一全新视角探索了现代卷积神经网络的表示能力。这种交互反映了不同尺度上下文中变量间的相互作用效果。提出了一种新的纯卷积神经网络架构族,称为MogaNet。MogaNet具有出色的可扩展性,在ImageNet和其他多种典型视觉基准测试中,与最先进的模型相比,其参数使用更高效,且具有竞争力的性能。原创 2024-02-12 17:44:02 · 1311 阅读 · 0 评论 -
MAE实战:使用MAE提高主干网络的精度(一)
MAE已经出来有几年了,很多人还不知道怎么去使用,本文通过两个例子说明一下。分两部分,一部分介绍一个简单的例子,让大家了解MAE训练的流程。一部分是一个新的模型,让大家了解如何将自己的模型加入MAE。论文标题: Masked Autoencoders Are Scalable Vision Learners论文地址:https://arxiv.org/abs/2111.06377代码地址:https://github.com/facebookresearch/maeMAE的两个核心设计:参考文章:https原创 2024-02-04 20:00:00 · 3366 阅读 · 3 评论 -
Vim实战:使用 Vim实现图像分类任务(二)
训练部分。原创 2024-01-30 07:08:25 · 1445 阅读 · 0 评论 -
Vim实战:使用Vim实现图像分类任务(一)
论文:https://arxiv.org/pdf/2401.09417v1.pdf翻译:近年来,随着深度学习的发展,视觉模型在许多任务中取得了显著的成功。然而,随着模型规模和复杂度的增加,计算和内存的消耗也急剧增长。这限制了模型在资源有限的环境中的使用,尤其是在处理高分辨率图像时。为了解决这个问题,一种新的视觉模型架构——Vim(Vision with Mamba)被提出。Vim是一种基于状态空间模型(SSM)的视觉模型,利用了Mamba这种高效的硬件设计。原创 2024-01-29 21:21:10 · 2089 阅读 · 2 评论 -
FlashInternImage实战:使用 FlashInternImage实现图像分类任务(二)
训练部分。原创 2024-01-27 09:51:33 · 1188 阅读 · 0 评论 -
FlashInternImage实战:使用FlashInternImage实现图像分类任务(一)
论文介绍了Deformable Convolution v4(DCNv4),一种针对广泛视觉应用的高效有效运算符。DCNv4通过两个关键改进解决了其前身DCNv3的局限性:1)在空间聚合中移除softmax归一化,以增强其动态特性和表达力;2)优化内存访问,以最小化冗余操作并加速处理速度。这些改进使得DCNv4相比DCNv3具有更快的收敛速度和显著的性能提升,处理速度提高了三倍以上。DCNv4在图像分类、实例和语义分割等任务中表现出色,尤其在图像生成方面表现突出。原创 2024-01-26 21:41:48 · 1335 阅读 · 0 评论 -
UniRepLKNet实战:使用 UniRepLKNet实现图像分类任务(二)
训练部分。原创 2024-01-13 22:12:48 · 1582 阅读 · 0 评论 -
基于Flask的高并发部署方案
Flask 是一个轻量级的 Python Web 框架,它非常适合构建小型到中型的应用程序。Flask 的特点:轻量级:相比于 Django,Flask 更轻量级,更适合小型项目或微服务。简单:Flask 的 API 非常简洁,易于学习和使用。灵活:Flask 提供了基础功能,但并不限制开发者如何实现这些功能。扩展性强:有许多针对 Flask 的扩展,可以轻松地添加新功能。基本组件:路由:定义了 URL 和处理它们的函数之间的映射关系。模板引擎:用于渲染 HTML 页面。URL 构建。原创 2024-01-11 21:30:31 · 2931 阅读 · 5 评论 -
UniRepLKNet实战:使用UniRepLKNet实现图像分类任务(一)
大核卷积神经网络(ConvNets)近年来受到广泛关注,但仍存在两个关键问题需要进一步研究。首先,目前的大型卷积神经网络架构大多遵循传统卷积神经网络或Transformer的设计原则,而大核ConvNets的架构设计仍未得到充分解决。其次,尽管Transformer已在多种模态中占据主导地位,但仍需研究卷积神经网络是否也具备超越视觉领域的强大通用感知能力。本文从两个方面进行了贡献。首先,提出了设计大型卷积神经网络的四项架构准则。核心思想是利用大型内核与小型内核的本质区别:大型内核可以广角观察而无需深入。原创 2024-01-10 21:02:09 · 1574 阅读 · 4 评论 -
【论文阅读】MCANet: Medical Image Segmentation with Multi-Scale Cross-Axis Attention
链接:https://arxiv.org/abs/2312.08866医学图像分割是医学图像处理和计算机视觉领域的关键挑战之一。由于病变区域或器官的大小和形状各异,有效地捕捉多尺度信息和建立像素间的长距离依赖性至关重要。本文提出了一种基于高效轴向注意力的多尺度交叉轴注意(MCA)方法来解决这些问题。MCA通过计算两个并行轴向注意力之间的双向交叉注意力,以更好地捕获全局信息。原创 2023-12-25 09:15:24 · 2906 阅读 · 1 评论 -
RevCol实战:使用RevCol实现图像分类任务(一)
可逆柱状结构(RevCol)是一种网络结构,它受到GLOM(Global Columnar Memory)的启发。RevCol由N个子网络(或称为列)组成,每个子网络的结构和功能都是相同的。这种结构可以有效地解决信息崩溃的问题,通过在前面的列中添加额外的监督,以保持特征和输入图像之间的互信息。此外,RevCol可以逐渐解耦语义和低级信息,从而提取和利用任务相关信息来进一步提高性能。在实现上,对于中间监督,采用了加权求和的方式将两个损失合并,对于所有变体的RevCol,通过实验确定将监督头添加到特定的列中。原创 2023-11-25 08:46:46 · 1355 阅读 · 0 评论 -
【第80篇】Lion:优化算法的符号发现
本文提出一种将算法发现表述为程序搜索的方法,并将其应用于发现用于深度神经网络训练的优化算法。利用高效的搜索技术来探索无限和稀疏的程序空间。为弥合代理任务和目标任务之间的巨大泛化差距,还引入了程序选择和简化策略。该方法发现了一种简单有效的优化算法Lion (evolutionary Sign Momentum)。它比Adam更节省内存,因为它只记录动量。与自适应优化器不同,通过符号操作计算的每个参数的更新具有相同的幅度。原创 2023-04-12 06:00:00 · 889 阅读 · 1 评论 -
第十二篇 GoogLeNet——网络实战
到这里,这篇文章就写完了,通过这篇文章,你能学到:1、如何训练模型?2、如何推理?3、如何读取数据集、处理数据集?4、如何使用余弦退火调整学习率?5、如何保存权重文件和整个模型文件?6、如何使用评价指标,如ACC、ReCall等指标评价模型。7、如何使用matplotlib.pyplot绘制acc和loss曲线图?有没有发现,我们的实战代码正在逐渐的丰富起来。我打算通过这种逐步增加难度的方式,让大家更容易接受!2 划分训练集和测试集🐇4.9 训练函数。原创 2023-02-01 21:52:51 · 1358 阅读 · 0 评论 -
网络摄像头拉流方法总结(附python代码)
网络摄像头拉流是获取图片数据常用的方法,本文总结了几种从网络摄像头拉流的方法。原创 2023-01-28 12:47:37 · 4344 阅读 · 8 评论 -
第三篇 制作数据集
如果有不对的地方,还请大家指出!原创 2023-01-09 07:03:58 · 920 阅读 · 0 评论 -
nn.AdaptiveAvgPool2d和nn.AvgPool2d的区别
功能:该函数与二维平均池化运算类似,区别主要体现在自适应上,对于任何输入大小,输出大小均为指定的H×W大小。output_size:指定的输出大小,可以是元组(H,W),或者是单个的数,如果是单个的数,则表示输出的高和宽尺寸一样,output_size大小可以大于输入的图片尺寸大小。原创 2022-12-21 17:44:13 · 2726 阅读 · 0 评论 -
关于pytorch中,self.training的理解
这段代码来自deit的代码,在训练的时候,你会发现self.training为True,在推理的时候self.training为False,如果直接搜索training这个字段,你发现只有一个结果,没有看到在哪里赋值,只有这一处在使用,我们继续寻找父类VisionTransformer,发现VisionTransformer里面也没有,只能继续寻找父类nn.Module,在这个类里面找到了。最近在看源码的过程中看到了有些模型的forward函数中self.training判断训练还是推理的状态。原创 2022-12-20 13:54:37 · 1934 阅读 · 3 评论 -
Pytorch2.0发布了,向下兼容,加一句代码,性能翻番
介绍PyTorch 2.0,我们迈向PyTorch下一代2系列发行版的第一步。在过去的几年里,我们进行了创新和迭代,从PyTorch 1.0到最近的1.13,并转移到新成立的PyTorch基金会,它是Linux基金会的一部分。除了我们令人惊叹的社区之外,PyTorch最大的优势是我们继续作为一流的Python集成、命令式风格、API和选项的简单性。PyTorch 2.0提供了相同的急切模式开发和用户体验,同时从根本上改变和加强了PyTorch在底层编译器级别的操作方式。我们能够为动态形状和分布式提供更快的性原创 2022-12-05 11:01:17 · 2942 阅读 · 1 评论 -
推荐一个对pytorch代码详细注释的github项目
今天在无意间找一个pytorch代码和注释的Github项目。先上项目:这个项目还有个网站,地址:https://nn.labml.ai/原创 2022-12-02 16:28:19 · 3715 阅读 · 10 评论 -
AugMixDataset的一些示例
1、第一个示例第二个示例第三个示例剩下的详见:https://programtalk.com/python-more-examples/timm.data.AugMixDataset/原创 2022-11-22 18:04:03 · 657 阅读 · 0 评论 -
盘点AI的认证
近年来,在数字经济不断推进的大背景下,人工智能发展迅速,并与多种应用场景深度融合。深度理解人工智能行业,也逐渐成为推动经济创新发展的重要技术。AI认证作为衡量AI工程师能力水平的重要标准,越来越受到行业的青睐。今天我们就盘点一下哪些值得考的AI认证吧!原创 2022-11-05 14:08:19 · 3175 阅读 · 10 评论 -
手把手教你搭建YOLOv5 + StrongSORT with OSNet环境
YOLOv5 + StrongSORT with OSNet模型由YOLOv5检测器 、StrongSORT跟踪算法、OSNet行人重识别模型组成项目地址:由于现在的代码中没有yolov5和reid代码,所以需要下载源码加入到YOLOv5 + StrongSORT with OSNet项目中。yolov5下载地址:下载代码后,放到yolov5的文件夹中,如下图:”原创 2022-11-04 15:58:40 · 2882 阅读 · 7 评论 -
从COCO数据集和VOC数据集提取特定的类别
这篇文章主要讲如何从VOC和COCO数据集中提取特定的类,比如人。我们想做个行人检测的项目,需要从一些公开的数据集中提取一些行人的数据做补充。原创 2022-10-18 14:12:51 · 2142 阅读 · 1 评论 -
dng格式的图片转png
【代码】dng格式的图片转png。原创 2022-10-17 18:28:48 · 921 阅读 · 0 评论 -
Labelme转Yolov5 全新整理
【代码】Labelme转Yolov5 全新整理。原创 2022-10-17 17:46:02 · 544 阅读 · 0 评论 -
python 写入格式化的json
在用json.dump写入json文件的时候加入indent参数就可以实现json的格式化。原创 2022-10-17 17:14:22 · 1219 阅读 · 0 评论 -
moviepy处理视频帧和遍历的方式处理视频帧速度对比。
MoviePy是一个用于视频编辑的Python模块,它可被用于一些基本操作(如剪切、拼接、插入标题)、视频合成(即非线性编辑)、视频处理和创建高级特效。它可对大多数常见视频格式进行读写,包括GIF。示例如下(IPython Notebook环境)原创 2022-10-14 14:37:11 · 3206 阅读 · 1 评论 -
【第50篇】迈向快速、灵活、稳健的微光图像增强
微光图像增强旨在使隐藏在黑暗中的信息可见,从而提高图像质量,近年来在多个新兴的计算机视觉领域受到了广泛关注[18,24,25]。下面,我们将梳理两个相关课题的发展过程。进一步,我们描述了我们的主要贡献。基于模型的方法。一般来说,Retinex理论[16]描述了微光图像增强的基本物理规律,即微光观测可分解为照度和反射率(即清晰图像)。Fu等[5,6]使用ℓ2-normℓ2-norm作为解决方案,首先利用ℓ2-normℓ2-norm来约束光照。原创 2022-10-08 16:24:49 · 1034 阅读 · 0 评论 -
时间序列中的轨迹聚类
时间序列的聚类在时间序列分析中是非常重要的课题,在很多真实工业场景中非常有用,如潜在客户的发掘,异常检测,用户画像构建等。不同于一般样本聚类方式,时间序列因为其独特的时变特性,很多研究者都在探寻如何对其轨迹进行聚类。然而轨迹聚类非常有挑战。首先,时间序列一般存在大量的噪声,这会引入较大的误差;其次,时间序列很多时候存在错位匹配的情况,需要采用相似性度量算法来解决,实际中需要根据场景做额外处理;最后,聚类方法和参数选择也有不少的讲究。整体来说,时序的轨迹聚类需要借助大量的领域知识来共同完成。转载 2022-10-02 06:56:39 · 1382 阅读 · 0 评论 -
CVPR 2022 Oral | 大连理工提出SCI:快速、超强的低光照图像增强方法
本文提出的SCI在图像质量和推理速度方面均取得了突破,为低光照图像增强任务的解决提供了一种新的视角,即如何在有限资源下赋予网络模型更强的刻画能力,该种视角相信也能够为其他相关视觉增强领域带来启发。未来,作者将继续探究如何设计更有效的学习手段来建立轻量、鲁棒、面向更具有挑战真实场景的低光照图像增强方案。转载 2022-10-01 17:14:43 · 886 阅读 · 0 评论 -
判断torch.device是gpu还是cpu
这样直接判断是有问题,会有问题,因为torch.device是class类型。原创 2022-09-29 12:50:04 · 2136 阅读 · 0 评论 -
文字生成图片
PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型【模型种类丰富】: 涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的 360+ 预训练模型,全部开源下载,离线可运行【超低使用门槛】:无需深度学习背景、无需数据与训练过程,可快速使用AI模型【一键模型快速预测】:通过一行命令行或者极简的Python API实现模型调用,可快速体验模型效果【一键模型转服务化】:一行命令,搭建深度学习模型API服务化部署能力。原创 2022-09-28 14:07:59 · 20545 阅读 · 28 评论 -
计算机视觉与模式识别学术速递[2022.9.20]
机构: Oden Institute, The University of Texas at Austin, Austin, TX, USA, Institute for Parallel and Distributed Systems, University of Stuttgart, Stuttgart, DE, Department of Mathematics, University of Houston, Houston, TX, USA。转载 2022-09-24 18:02:35 · 7525 阅读 · 0 评论 -
雾天行人车辆检测
一. 提前注册或登陆百度智能云账号,我们的任务将在BML平台进行网址:https://ai.baidu.com/bml/点击立即使用注册或登录百度云账号点击【预置模型调参】选择【模型】,点击【立即创建】填写相关信息注意这里的信息填写要与你在报名时填的信息一致,否则打卡无效。✅开发者/企业用户则输入公司全称,模型归属选择公司✅如果还在上学,则输入学校全称,模式归属选择个人填写描述 完成【创建】二. 数据集下载(请下载至本地)点击【创建数据集】⬇️⬇️⬇️⬇️⬇️⬇️。原创 2022-09-16 21:41:12 · 1342 阅读 · 0 评论 -
如何阅读AI顶会论文?
AI的论文多是英文,尤其是顶会论文都是英文。那么我们如何去读呢?我认为英文不是个问题,现在的翻译工具很强大,基本上通过翻译我们就能得到论文所表达的意思。接下来就是如何去读的问题。论文的章节比较固定。主要有以下几个部分:首先是摘要部分,概括的介绍论文的方向,论文的一些优点,如果开源代码,也会放在摘要的末尾。第一章节是简介,介绍以前人做的研究和作者对这些研究不足的思考和论文的贡献,和取得的成绩。第二章节是相关工作,这部分较为详细的叙述论文的贡献。通过对这一节的阅读可以学习到模型的优点。第三章是对模型详细描述,这原创 2022-06-20 14:46:55 · 1061 阅读 · 1 评论 -
云原生的入门知识
近年来,随着云计算概念和技术的普及,云原生一词也越来越热门,无论是应用还是安全,凡是和云相关的,都要在云后面加上原生二字,好像不提云原生,在技术上就落后了一大截。那到底什么是云原生?云原生是怎么产生的?云原生能带来什么好处?如何实现云原生?随着云计算技术的发展,企业上云已成为趋势,越来越多的企业都已将应用部署到了云上。但是应用上云并不意味着就能充分利用云平台的优势。目前,大部分云化的应用,都是基于传统的软件架构来搭建的,然后再移植到云上去运行,和云平台的整合度非常低,主要表现在以下几个方面:操作系统依赖强:原创 2022-06-02 15:59:07 · 3101 阅读 · 9 评论 -
鲁棒性的含义以及如何提高模型的鲁棒性
1、含义鲁棒是Robust的音译,也就是健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,也是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。鲁棒性包括稳定鲁棒性和品质鲁棒性。一个控制系统是否具有鲁棒性,是它能否真正实际应用的关键。因此,现代控原创 2022-06-01 07:00:00 · 41605 阅读 · 1 评论 -
non_blocking参数的设置。
问题:images.cuda(non_blocking=True),target.cuda(non_blocking=True)把数据迁移到GPU里面;nn.DataParallel(model.to(device), device_ids=gpus, output_device=gpus[0])包装模型。images.cuda(non_blocking=True)为何要设置参数non_blocking=True呢?解释:non_blocking默认值为False, 通常我们会在加载数据时,将Dat原创 2022-05-29 18:25:50 · 4220 阅读 · 0 评论 -
AverageMeter类的作用
AverageMeter类的作用:用来管理一些自定义的变量。代码如下:class AverageMeter: """Computes and stores the average and current value""" def __init__(self): self.reset() def reset(self): self.val = 0 self.avg = 0 self.sum = 0原创 2022-05-27 09:48:20 · 3801 阅读 · 0 评论