binveni-CSDN博客

原创 yolov9

本文将深入研究数据丢失的重要问题，即信息瓶颈和可逆函数。我们提出了可编程梯度信息 (PGI) 的概念来应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息来更新网络权重。此外，设计了一种基于梯度路径规划的广义高效层聚合网络(GELAN)。GELAN 的架构证实 PGI 在轻量级模型上获得了更好的结果。

2024-03-21 14:58:44 882 1

原创 YOLOv5详解（理论+代码）

YOLOv5于2020年首次提出，直至今日YOLOv5仍然在不断进行升级迭代。本文详细介绍了YOLOv5使用的结构和损失函数，并给出代码实现

2024-01-07 00:58:18 2863 1

原创 DBNet论文与代码

DBnet是一种用于文本检测的深度学习模型，在文件检测领域面临的挑战主要有：文本的多样性：颜色、大小、字体、语言、方向、文本长度和文本弯曲等都会影响文本的检测效果复杂的背景干扰：图像失真、模糊、低分辨率、亮度等都会影响检测效果文本分布密集、文本内容重叠文本存在局部一致性，即文本的一部分也可视为独立的文目前主流的文本检测方法可以分为两大类，一是基于回归的方法，二是基于分割的方法。

2023-12-28 00:09:07 1845 1

原创自监督（一）

MoCo于2019年11月13在 CVPR发表，并获得 CVPR2020最佳论文提名，它是用一种对比学习的方式进行自监督训练的模型。MoCo是第一个在很多主流的机器视觉领域上（比如分类、检测、分割、人体关键点检测等），都超越了有监督预训练模型的无监督模型，从某种程度上证明了无监督学习在机器视觉领域，也能达到很好的效果。

2023-12-25 23:00:08 950

动态库和静态库都是一种可执行代码的二进制形式，可以被操作系统载入内存执行。静态库实际上是在链接时被链接到exe的，编译后，静态库会嵌入到生成的exe文件中，执行到静态库的内容时，在exe的内存中就能获取到相关内容，库本身不需要与可执行文件一起发行，但是因为所有相关的目标文件与牵涉到的函数库被链接合成一个可执行文件，生成的可执行文件较大。如果不同程序使用相同的静态库，静态库会分别被嵌入不同程序，造成空间浪费。并且如果静态库有任何更新，所有使用它的应用程序都要重新编译。

2023-09-04 21:00:49 304 1

原创 opencv_1

如果安装成功，并且路径正确，会弹出一个名为windiws的窗口，窗口显示内容为你路径指向的图片。

2023-07-30 23:21:25 54 1

原创解决Mac终端每次打开都要重新source .bash_profile文件才能生效问题

注意：在刷新source ~/.bash_profile前要开启一个终端，要不然可能中端打开会提示[进程已完成]，然后无法使用终端，这时需要把.zshrc文件中端内容删除，然后重新打中端，然后按照起步骤1-3操作。打开这个文件写入source ~/.bash_profile然后保存（command + s）关闭。然后在前面没有关闭的终端中输入。

2023-07-30 19:52:35 1907 2

binveni的博客