自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 问答 (2)
  • 收藏
  • 关注

原创 【TPAMI-2024】EfficientTrain++帮你降低网络训练的成本

该出了一种新的广义课程学习方法EfficientTrain++,总是利用每个学习阶段的所有数据,但只在训练开始时暴露每个示例的“容易学习”模式(例如,在数据增强之前,图像和原始信息的低频成分),并随着学习的进展逐渐引入更困难的模式。为了设计一个合适的课程学习计划,提出了一个定制的计算约束的顺序搜索算法,产生一个简单的,良好的泛化,但惊人的有效的训练课程。

2024-06-04 14:53:00 957

原创 【U-Net验证】逐元素乘积将特征投射到极高维隐式特征空间的能力

本文将U-Net解码中的特征拼接修改为逐元素求和和逐元素乘积,并针对血管分割任务进行了性能评估。实验结果显示,在无激活函数时,逐元素乘积在多个关键指标上均优于逐元素求和,性能提升幅度在0.2%至3%之间,表明逐元素乘积确实能在一定程度上提供更高维度的隐式空间。从分割结果来看,逐元素乘积似乎对较大的血管具有更好的分割效果,能够更准确地捕捉血管的轮廓和细节。同时,使用逐元素乘积的分割结果也表现出更高的光滑性和一致性,减少了噪声和伪影的干扰,从而提高了分割结果的可靠性和可读性。

2024-06-02 13:02:32 635

原创 【CVPR_2024】:逐元素乘积为什么会产生如此令人满意的结果?

该论文则是通过明确地证明星型运算具有将输入映射到一个非常高维的非线性特征空间的能力,来解释星型运算的强代表性能力。- 揭示了星形运算具有将特征投射到极高维隐式特征空间的能力- 通过实证结果和理论探索来验证分析以及视觉表现- 提出StarNet,超越了许多高效的设计。- 该论文的分析可作为一个指导框架,引导研究人员进行的络设计。

2024-06-01 17:26:02 1218

原创 PSFRGAN量化:量化技术、实现步骤与常见问题解决

本文深入探讨了PyTorch框架下的模型量化技术,介绍了量化的一般流程,包括动态量化和训练后量化等,以PSFR-GAN为例,详细介绍了其训练后静态量化的步骤,包括模型加载、静态量化、模型定义、QuantStub和DeQuantStub的使用,以及运算改写等关键步骤。同时,文章也记录了在量化过程中遇到的一些问题和挑战。

2024-05-12 14:13:08 712

原创 PSFR-GAN复现

PSFR-GAN是一个基于深度学习的开源项目,其主要目标是实现高质量的人脸图像盲复原。PSFR-GAN的核心是生成对抗网络,包括两个部分:生成器和判别器。生成器负责从低分辨率图像生成高分辨率图像,而判别器则试图区分真实高分辨率图像与生成器产生的图像。在训练过程中,这两个网络相互竞争并共同提升,直至生成器可以产出难以被判别器识破的高分辨率图像。PSFR-GAN在图像超分辨率重建方面有以下特点:结合了几何先验,能够生成具有清晰面部形状和逼真面部细节的图像。

2024-05-06 12:32:30 875

原创 PyCharm环境下Git与Gitee联动:本地与远程仓库操作实战及常见问题解决方案

本篇文章详细阐述了如何在PyCharm集成开发环境中整合Git与Gitee服务,以实现本地与远程仓库的有效管理和协作。首先介绍了Git的安装以及Git在PyCharm中的配置与基本使用,包括如何创建仓库、创建与切换分支、提交代码等操作。随后,针对可能遇到的常见问题,如无法创建分支、推送失败等,提供了参考解决步骤与策略。旨在帮助读者更好地利用PyCharm与Gitee的无缝衔接,提升开发效率与版本控制能力。

2024-03-25 16:49:36 4441

原创 内部控制提纲

在撰写论文时,可以根据实际情况调整论文提纲的结构和内容,确保论文的逻辑性和连贯性。同时,要注重理论与实践相结合,充分引用相关文献和案例,以提高论文的说服力和可信度。5.3 内部控制优化策略的实际应用效果。3.1 企业内部控制体系的建设情况。5.2 内部控制优化前后的对比分析。3.2 内部控制存在的问题与不足。1.1 内部控制的定义与重要性。1.2 内部控制的目标与原则。2.1 内部控制框架与模型。2.2 内部控制要素与关系。2.3 内部控制理论的发展。四、内部控制优化策略与建议。

2024-02-28 19:59:59 502

原创 远程连接服务器:Ping通但SSH连接失败的解决办法

远程连接VPN可能存在些问题,导致无法成功连接,因此在本文中,将详细介绍SSH连接远程失败的问题和解决步骤,通过这些信息,希望帮助小伙伴更好地解决VPN连接的问题,以便在必要时能够有效地进行居家学习/办公。

2024-01-31 15:15:50 12120

原创 电脑重装后恢复音频输出(安装声卡驱动)

在安装声卡驱动之前,首先需要了解主板型号和操作系统版本,以便下载正确的驱动程序。通常,您可以在对应官方网站上找到与主板和操作系统相匹配的声卡驱动程序。下载并解压缩声卡驱动程序。确保从官方网站下载正确的驱动程序版本,并将其解压缩到计算机上。安装声卡驱动程序。打开解压缩的声卡驱动程序文件夹,运行安装程序。按照屏幕上的指示进行操作,完成声卡驱动程序的安装。并配置音频输出。

2024-01-04 20:50:13 4300

原创 你的轻量化设计能有效提高模型的推理速度吗?

轻量化网络是指在保持较高性能的同时大大减少模型参数和计算量的神经网络模型。轻量化网络的出现是为了解决在移动设备和嵌入式系统等资源受限的环境中部署深度学习模型时所面临的挑战。传统的深度学习模型通常包含大量的参数和复杂的计算结构,这使得它们在移动设备上运行时需要消耗大量的内存和计算资源。而轻量化网络通过精心设计结构和参数,可以在移动端实现更加高效的部署,从而适应移动设备上的应用需求。因此轻量化网络的研究和发展是深度学习领域的一个重要方向,涉及网络结构设计、模型压缩、量化技术、剪枝等多个方面。

2023-12-07 15:08:27 1171

原创 正则化与正则剪枝

正则化是一种在机器学习中用于控制模型复杂度的技术,它通过在损失函数中添加一个额外项来对参数进行约束,从而避免过拟合。其中,L1正则化通过对参数的绝对值求和来实现,能够产生稀疏权重;L2正则化通过对参数的平方和求根号来实现,能够产生较为平滑的权重;实际上可以结合两者来共同约束参数。在实际应用中,正则化可以帮助模型更好地泛化数据,提高模型的鲁棒性和可靠性。同时,正则化也需要根据具体问题进行调整,不同的正则化方法和系数可能会产生不同的效果。

2023-11-26 21:58:01 1282

原创 MobileNets发展与总结

MobileNet是一种轻量级的深度卷积神经网络(CNN),旨在在计算资源有限的移动设备上实现高效的图像分类和目标检测。MobileNet的设计出发点是通过减少模型参数和计算量来提高模型的速度和效率,同时尽可能保持模型的准确性。MobileNet首先引入了深度可分离卷积(Depthwise Separable Convolution)结构。随后MobileNet后续由一系列的Inverted Residual Blocks组成。

2023-11-25 14:15:07 1006

原创 【手写快排与Sort】

- 快速排序适合所有情况?数据量少时,效率可能低于简单排序。 - 时间复杂度不是稳定的O(nlogn),最坏情况会退化为冒泡 - 递归层次过深会导致性能下降、栈溢出甚至程序崩溃

2023-10-31 10:20:26 248

原创 【阿里云试用计划】免费试用GPU

随着数据集越来越大,各种深度学习任务如图像、扩散模型、多模态、大模型等对算力的要求也稳步较高、为提高模型性能网络参数也逐步提升,以至于想要体验都不方便,更别提需要训练网络的学生。因此白嫖算力成为一种无奈之举,下面提供一种途径:阿里云试用计划,希望对小伙伴们有帮助。

2023-07-22 19:24:36 1689 2

原创 【工具网站】

旨在分享一些常见、实用、干净的一些工具网站,希望可以在日常的学习和工作中帮助到小伙伴们,有兴趣的可以去尝试,不定时更新呢!

2023-07-21 14:32:34 174

原创 【论文学习】PromptIR:一种基于提示学习的一体化图像恢复方法

PromptIR:一种基于提示学习的方法来执行一体化图像恢复。具有以下的特点①完全依赖于输入图像来恢复干净的图像,而不需要任何退化的先验知识。②很容易地集成到任何现有的恢复网络。。③具有动态适应能力

2023-07-20 11:28:27 1847 11

原创 【视频的动态对比】

主要是实现视频修复后的视频动态对比,以及部分的人脸、关键点检测,video提取音频、视频添加声音、video转GIF等功能。

2023-07-19 21:28:59 378

原创 Markdown常见语法

一个有写博客的人,难免会遇到markdown语法不会,本博客主要记录一些常见但是不易记的内容以备查询。暂时包含的内容有:标题、字体、图片等常见的设置,如大小,颜色、排列等。

2023-07-18 16:59:14 67

原创 【论文学习】RAHC:一种处理五种常见天气的任意混合退化的图像修复方法

RAHC通过AdverseGAN学习隐式退化提供成对的训练数据,使用三种量身定制的设计结构,以一次性恢复任意混合恶劣天气条件(图1(d)),具有下列特点:①多天气退化表示的多头混合块(MHBB):覆盖卷积和注意混合算子的多头机制可以为混合多天气学习提供多个“表示子空间”以及互补特征。②用于图像成分保留有限的混合条件下的重建向量辅助恢复(RVA):在大规模自然图像上预训练的Codebook中封装的离散表示(重建向量),可以提供额外的视觉内容线索,以辅助重建真实而清晰的输出。③高效任意混合条件恢复

2023-07-18 14:56:30 649 2

原创 Jupyter Notebook 后台启动

后台启动 jupyter notebook,或者服务器上启动 可通过浏览器访问。查找进程,适用于kernel 死亡,或者关闭jupyter notebook。注意:无法导入依赖包,查看是否激活对应环境。可以查看对应的进程,pid编号,用于停止。激活环境 conda activate。kill 进程 kill PID。如需重新启动,则参考步骤 1-3。再次查看,确认关闭该进程。

2023-07-17 16:56:09 1635 1

原创 【论文学习】DifFace:一个建立在后验分布上的鲁棒扩散模型

DifFace是这么一个通过建立低质量(LQ)图像到高质量(HQ)图像的后验分布,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①后验分布:从LQ图像开始到理想HQ图像结束的马尔可夫链。②在反向扩散过程中部分构建马尔可夫链以利用在预训练扩散模型中捕获的图像。③没有复杂损失,只需要训练一个具有L2损失的神经网络,简化了训练。

2023-07-16 14:07:53 574

原创 【论文学习】Panini-Net:一种可根据退化程度动态融合特征复原方法

Panini-Net通过无监督退化表示学习策略来提取退化图像的判别退化表示,并作为动态融合的全局条件,以生成具有清晰面部形状和逼真面部细节的图像,具有下列特点:①化感知特征插值(DAFI)模块。②无监督退化表示学习策略。③特征提取模块。

2023-07-15 21:47:17 327

原创 【论文学习】PSFR-GAN:一种结合几何先验的渐进式复原网络

PSFR-GAN将结合几何先验,以生成具有清晰面部形状和逼真面部细节的图像。①通过FPN为LQ输入生成解析映射②以多尺度LQ图像和解析图为输入,通过语义感知风格变换,逐步恢复高质量的人脸细节。③引入语义感知风格损失,有助于提高不同语义区域的纹理恢复,减少伪影的发生。

2023-07-14 13:50:06 312

原创 【论文学习】GCFSR:一种无需先验的强度可调的人脸超分框架

GCFSR有下列优势:①生成强度可以交互调节。②样式调制和特征调制模块。③GCFSR具有良好的训练性能,端到端可训练的,收敛速度快。

2023-07-13 17:20:40 332

原创 【论文学习】SGPN:一种形状和生成先验相结合盲脸复原的方法

SGPN包含下列内容:①网络包含形状恢复模块和与生成先验模块;②自适应特征融合块作为基本生成GAN块;③图像级重建损失Lrec和对抗损失Ladv被用来增强图像的保真度和真实感;④网格级三维地标损失L3dlm和网格损失Lmesh被用来增强形状恢复。

2023-07-13 15:53:59 370 1

原创 【反转链表合集】

反转单链表、反转链表中K个元素,每K个元素翻转

2023-06-11 11:55:11 45

原创 【111】二叉树的最小深度(深度优先(DFS)、广度优先(BFS))

写在前面:本博客仅作记录学习之用,部分图片来自网络,如需使用请注明出处,同时如有侵犯您的权益,请联系删除!

2023-05-29 20:44:40 293

原创 【88】合并两个有序数组(合并排序、双指针、直接插入)

简单:力扣88:合并两个有序数组

2023-05-28 16:15:51 77

原创 【441】排列硬币(暴力迭代、二分查找、牛顿迭代)

简单:力扣:硬币排列

2023-05-27 14:09:27 319

原创 【509】斐波那契数(暴力递归、递归优化、双指针迭代)

简单:力扣509:斐波那契数

2023-05-25 21:22:50 64

原创 【628】数组三元素乘积最大(暴力、线性搜索)

简单:力扣628:三个数的最大乘积

2023-05-25 15:58:13 62

原创 构建高效、精准的人脸识别系统——RetinaFace、FaceNet和MySQL基础上的实践与总结

本文讨论的人脸识别方法主要分为三个部分,其中第一个部分是检测网络RetinaFace,用于检测人脸;第二个部分是Facenet,用于生成身份识别所需的特征,第三部分是基于Mysql的人脸特征存储与识别。该方法具有精度较高、鲁棒性强、实时性好、数据库管理方便的特点。本文将从基础准备、人脸检测、人脸处理、身份识别、以及数据库等方面进行说明,内容有点长,请耐心看完。

2023-05-15 20:17:30 1152

原创 【Mmediting的使用踩坑记录】

足下潇洒美少年,举觞白眼望青天,皎如玉树临风前。Mmediting是一个由开发者大力维护的开源深度学习库,它致力于提供高效和先进的图像和视频编辑工具。基于PyTorch实现,Mmediting依赖于许多常见的深度学习库,例如CUDA和CUDNN,以实现高性能的图像和视频处理。它提供了强大的超分辨率、去噪、修复、颜色转换、图像合成、视觉效果等功能,可以帮助用户在不同的应用场景下完成各种图像和视频处理任务。

2023-05-01 20:50:49 284

原创 【基于BasicSR的GCFSR复现踩坑】

超分辨率是指将低分辨率图像通过算法提升其分辨率,使其看起来更加清晰、细腻。在计算机视觉领域,超分辨率技术应用广泛,包括图像处理、视频压缩、安防监控等。为了进行超分辨率项目开发,需要配置相应的环境。一般来说,超分辨率算法需要依赖于深度学习框架和图像处理库等多个组件。GCFSR是一种无需GAN先验的生成式超分辨率方法,旨在提高人脸图像的分辨率。该方法采用了Encoder-Generator架构,并设计了样式调制模块和特征调制模块。

2023-03-21 10:46:12 2488 54

原创 python 多折线绘制和局部放大

在本文中,我们将介绍如何使用Matplotlib和其他相关库来实现多折线绘制和局部放大,以满足数据分析和可视化的需求。

2023-02-27 18:26:45 1464

原创 【学习记录】OpenCV鼠标事件

本博客仅为学习记录之用,目的在于后续若需要相关的有资可查。如有错误,欢迎指出交流学习!本博客包含鼠标事件的应用: 鼠标事件的应用;图片动态局部放大;动态绘制矩形框用以放大;cv2多行文本的显示。以上就是本文的主要内容,主要是OpenCV鼠标事件的基本使用。

2022-10-25 20:35:45 1796

原创 从头到尾的一次模型搭建训练测试流程

本博客仅为学习记录之用,目的在于后续若需要相关的有资可查。在言语上恐有诸多纰漏,如有错误,欢迎指出交流学习!本博客所包含的大致内容:一个简单的模型搭建流程,包括:数据加载、模型结构、训练网络、指标计算及绘图、README.md撰写等等。相关涉及内容:解析命令行的简单使用;记录日志;混淆矩阵;ROC曲线等。

2022-08-10 15:09:33 542

原创 【言语加码,为爱发声】

希望大家在工作之余,献出自己的一点爱心。520不仅是为爱的人也要为需要帮助的那个陌生的她。

2022-08-02 21:00:31 137

原创 【学习记录】图片局部放大

写在前面:本博客仅作记录学习之用,部分图片来自网络,如需使用请注明出处,同时如有侵犯您的权益,请联系删除!文章目录前言局部放大函数实现单一局部放大置于图像内部多局部放大拼接于图形侧面主函数效果总结致谢前言本博客仅为学习记录之用,目的在于后续若需要相关的有资可查。在言语上恐有诸多纰漏,如有错误,欢迎指出交流学习!本博客所包含的大致内容: 图片某一局部放大并置于图形内部;图片多个局部放大并拼接在原图侧面。局部放大为什么要局部放大?无论的图像生成、修复、去污等等,如生成对抗方法;亦或是图像分割,如.

2022-07-26 14:12:15 1663

原创 [学习记录]基于小波变换的图片分解

本博客所包含的大致内容: 小波分解原理;基于python-opencv的RGB图像的小波分解与合成;基于PIL的RGB图像的小波分解与合成;解析命令行的简单使用。

2022-04-28 11:26:42 5771

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除