自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(106)
  • 资源 (1)
  • 收藏
  • 关注

原创 c++ 多线程 互锁 条件变量

【代码】c++ 多线程 互锁 条件变量。

2024-04-02 15:12:32 223

原创 【AIGC大模型】2024年02月论文 月总结

第一周:[Baichuan3] https://www.baichuan-ai.com/home [FAVA] https://arxiv.org/abs/2401.06855 [GPTVoiceTasker] https://arxiv.org/abs/2401.14268 [FuseLLM] https://arxiv.org/abs/2401.10491 [Lumiere] https://lumiere-video.github.io [Lumiere专题介绍] AI视频生成:Lumiere(超越

2024-02-29 21:22:26 977

原创 【AIGC大模型】InstantID 赏析

论文地址:https://arxiv.org/abs/2401.07519InstantID 主页:https://instantid.github.io/code:来自小红书的团队 最近开源了InstantID项目。InstantID 凭借着高质量的图像生成能力在 GitHub 热榜上迅速飙升,成为焦点。使用 Textual Inversion、DreamBooth 和 LoRA 等方法进行个性化图像合成取得了重大进展。

2024-02-29 20:57:23 1008

原创 【AIGC大模型】跑通wonder3D (windows)

先跑通开源工程代码

2024-02-25 15:48:20 742

原创 【AIGC大模型】Sora--首个大型视频生成模型

Sora通过分析大量的视频数据、学习物理规律的表现,并利用先进的算法理解和模拟时空连续性,从而能够生成看起来符合物理规律的视频。这一过程涉及到复杂的计算和大量的数据处理,最终使得Sora生成的视频在视觉上既真实又符合逻辑。AGI的未来或许真的不远了!

2024-02-21 21:03:43 1613 2

转载 【AIGC大模型】Stable Diffusion原理详解

本文向大家介绍了图像生成领域最前沿的Stable Diffusion模型。本质上Stable Diffusion属于潜在扩散模型(Latent Diffusion Model)。潜在扩散模型在生成细节丰富的不同背景的高分辨率图像方面非常稳健,同时还保留了图像的语义结构。因此,潜在扩散模型是图像生成即深度学习领域的一项重大进步。Stable Diffusion只是将潜在扩散模型应用于高分辨率图像,同时使用 CLIP 作为文本编码器。说了这么多理论,想必大家已经迫不及待跃跃欲试了。

2024-02-07 17:27:29 59

原创 pytorch 优化训练显存方式

一般在训练神经网络时,显存主要被网络模型和中间变量占用。 网络模型中的卷积层,全连接层和标准化层等的参数占用显存,而诸如激活层和池化层等本质上是不占用显存的。 中间变量包括特征图和优化器等,是消耗显存最多的部分。 其实 pytorch 本身也占用一些显存的,但占用不多,以下方法大致按照推荐的优先顺序。

2024-01-30 20:30:00 1195

原创 c/c++ 非托管环境 和 C#/JAVA 托管环境编译的基本原理

纯C/C++的程序通常运行在一个非托管环境中,类是由头文件(.h)和实现文件(.cpp)组成,每个类形成了一个单独的编译单元,当我们编译程序时,几个基本组件会把我们的源代码翻译成二进制代码。首先是预处理器,如果在项目中有头文件和宏表达式,那么它将负责包含头文件和翻译所有的宏观表达式。接下来是编译器,它不是直接生成二进制代码,而是生成汇编代码(.s),这基本上是所有现代的非结构化语言的共同基础。然后,汇编程序把汇编代码翻译成目标代码(.o和.obj文件,机器指令)。

2023-11-29 14:49:17 999

原创 使用Windows自带远程桌面连接 远程linux 桌面突然不能复制粘贴的解决办法

(1)在Windows资源管理器中关闭“rdpclip.exe”进程。(2)Win+R 输入 rdpclip.exe ,再回车。(3) 重新进入远程桌面 就可以复制粘贴啦。

2023-09-12 13:41:03 564

原创 linux清除显存占用:

i

2023-07-16 12:41:57 333

原创 ubuntu20.0 跑 paddle :ImportError: /opt/anaconda3/envs/paddle_pz/lib/python3.7/site-packages/paddle/

建议用代理运行,不然比较慢。

2023-07-12 15:46:37 532 2

原创 Transformer Vit Bert 的定义,区别和联系

通过自注意力机制,ViT可以捕捉图像中不同图块之间的全局关系,并在编码器输出后接一个MLP(多层感知机)进行分类任务。它根据每个位置与其他位置的相对重要性,为每个位置计算一个权重向量,然后将每个位置的信息进行加权求和。Bert通过先对大量未标记的文本进行预训练来学习通用的语言表示,然后通过在特定任务上进行微调来适应具体任务。它们都充分利用了Transformer模型中的自注意力机制、多层感知机和编码器结构等核心概念,并在各自领域展现了出色的性能。下面我将详细讨论它们的定义、区别和联系。

2023-06-21 20:30:00 1256

原创 【内存问题真的很烦人】linux内存等资源管理 以及 linux内存不足解决办法

//////////////////////////////////////////////这一部分存在疑问。

2023-06-21 20:00:00 2002

原创 Pytorch init定义的网络结构层能否在forward中重复使用?

参考。

2023-05-26 21:00:00 174

原创 pytorch训练模型pth导出为onnx ,再简化onnx模型

model=torch.load("/home/shangzaixing/code/LaneNet-PyTorch-RNN/pytorch-crnn.pth")#pytorch模型加载。export_onnx_file="/home/shangzaixing/code/LaneNet-PyTorch-RNN/pytorch-crnn.onnx"#目标ONNX文件名。dynamic_axes={"input":{0:"batch_size"},#批处理变量。batch_size=1#批处理大小。

2023-05-26 20:45:00 837

原创 关于opencv-python ,torch.tensor,Numpy的width height 的顺序

ROI =Mat[初始高:末尾高,初始宽:末尾宽]高,宽,通道 =Mat.shape。height 表示Y方向。width 表示X方向。//获取图像 高和宽。

2023-05-26 20:30:00 88

原创 Could not load the Qt platform plugin “xcb“

根据网上查阅的资料,可能是opencv-python的版本问题 ,我的是4.7.0.2 更换成4.6.0.66后问题消失了。可能是opencv4.7的版本和qt版本5.15.9不匹配?已放弃 (核心已转储)

2023-05-05 09:49:06 758 1

原创 svn 常用命令

Subversion(SVN) 是一个开源的版本控制系統, 也就是说 Subversion 管理着随时间改变的数据。这些数据放置在一个中央资料档案库(repository) 中。这个档案库很像一个普通的文件服务器, 不过它会记住每一次文件的变动。这样你就可以把档案恢复到旧的版本, 或是浏览文件的变动历史。

2023-04-07 14:30:34 8490

原创 在Linux中使用VSCode进行PyQt开发

在VSCode中按下Ctrl+Shift+P打开“命令面板”,输入“Python”,并选择“Python: Create New Blank Jupyter Notebook”命令。在弹出的窗口中为项目命名,并在代码中导入PyQt5模块。在VSCode中按下Ctrl+Shift+X打开“Extensions”页面,搜索“Python”,并安装Microsoft的Python扩展程序。该命令将会创建一个名为“pyqt_env”的虚拟环境,并在其中安装Python 3.8版本的Anaconda。

2023-04-06 10:30:48 824

原创 在vscode中使用Qtdesigner需要进行以下步骤:

这里的“yourfile.ui”是你Qtdesigner保存的文件名,而“yourfile.py”是你想要生成的.py文件的文件名。在vscode中打开项目,并在项目中创建.ui文件(可以通过文件->新建文件来创建.ui文件)。这样你就可以在vscode中使用Qtdesigner来创建你的GUI了。使用Qtdesigner窗口创建你的GUI,保存你的文件。打开anaconda虚拟环境,确保已经安装了pyqt。在代码中导入你生成的.py文件并创建你的gui。最后在main函数中实例化你的GUI对象并执行。

2023-04-06 10:25:01 2001

转载 【SVN工具使用】

最后修改的时间: 2011-07-29 17:50:31 +0800 (五,2011-07-29)版本库 UUID: da5e29f9-32f2-4640-9856-d331052c80e2。版本库根: svn://192.168.1.16/web/www.kukaka.org。查看原 svn 路径方法:svn info。最后修改的作者: yangzetao。2. 查看仓库地址 (URL)3. 更改仓库地址 (URL)最后修改的版本: 4584。如何查看原 svn 地址?

2023-03-31 10:58:44 420

原创 ubuntu22.04 安装mmocr报错 :ERROR: Failed building wheel for lanms-neo

gcc: fatal error: cannot execute ‘cc1plus’: execvp: 没有那个文件或目录 compilation terminated。只需要安装build-essential即可,作用是提供编译程序必须软件包的列表信息。cc1plus.exe是Bloodshed Dev-C++的C++针对这个报错信息,网上搜索解决办法,并没有解决问题。用于该软件对C++程序的编译功能。报错的信息的意思大概是“缺少。安装C++ 编译环境。

2023-03-31 09:30:39 429

原创 《AI在工业机器视觉检测中的应用123》(1.3)目标检测问题记录

(2)降低极小目标和大目标的类间不平衡。锚框设计难以获得平衡小目标召回率与计算成本之间的矛盾,而且这种方式导致了小目标的正样本与大目标的正样本极度不均衡,使得模型更加关注于大目标的检测性能,从而忽视了小目标的检测。(3)减小数据集里面同一类别里面目标特征的差异,例如将线状特征,点状特征,椭圆状特征的异物都标注为异物,这样是错误的,可以将其分别标注为线状异物,点状异物,椭圆状异物。(1)训练和推理时 将大分辨率图切割成小图(例如切割为320*320),模型输入分辨率设置为640*640,甚至更大。

2023-03-22 09:29:57 267

原创 《AI在工业机器视觉检测中的应用123》(1.2)目标检测模型训练 样本少的类别 反而recall和AP比较高?

此外,有时候数据不平衡也会导致一些类别训练得比其他类别更好。在目标检测中,某些类别可能在真实世界中出现的频率较低,因此在训练集中也缺乏大量的样本。这种情况可能是由于样本少的类别在训练过程中得到了更多的注意和重视,从而导致模型对其表现更好。因为训练集中样本数量较少,对于这些类别来说,它们在训练时能够接收到更多的反馈信号,从而使得模型学到的特征更加准确。因此,在评估模型性能时,需要结合多个指标进行综合考虑,而不是仅仅关注单一指标。因此,在评估模型性能时,需要结合多个指标进行综合考虑,而不是仅仅关注单一指标。

2023-03-13 10:06:09 137

原创 《AI在工业机器视觉检测中的应用123》(1.1) 目标检测样本类别不平衡的问题(持续更新...)

类别不平衡(class-imbalance),也叫数据倾斜,数据不平衡,就是指分类任务中不同类别的训练样例数目差别很大的情况。在现实的分类学习任务中,我们经常会遇到类别不平衡,例如交易欺诈、广告点击率预测、病毒脚本判断等;或者在通过拆分法解决多分类问题时,即使原始问题中不同类别的训练样例数目相当,在使用OvR(One vs. Rest)、MvM(Many vs. Many)策略后产生的二分类任务仍然可能出现类别不平衡现象。

2023-03-02 10:38:14 677

原创 cv2.seamlessClone报错 cv2.error: vector<T> too long或者‘cv::_OutputArray::release‘

mask 只有1行或者1列 为大于0的值时 报错: cv2.error: vector too long。mask 只有2行或者2列 为大于0的值时 报错:cv2.error: OpenCV(4.5.5) D:\a\opencv-python\opencv-python\opencv\modules\core\src\matrix_wrap.cpp:1667: error: (-215:Assertion failed) !fixedSize() in function 'cv::_Output

2023-02-10 10:29:05 990

原创 python opencv 判断一点是否在旋转椭圆内

2a为长轴,2b为短轴。对于这个椭圆,如果代入一个点(px,py),使得C>1,那么P在椭圆外,如果C

2023-02-08 14:05:23 695

原创 python中 PIL.Image、OpenCV、torch.tensor、numpy图像格式相互转换

3.2 tensor转换为PIL Image。3.3 PIL Image转换为tensor。3.4 Numpy转换为PIL Image。3.1tensor 转换成numpy。1、PIL.Image转换成。组合中正则化操作的前面即可。

2023-02-06 15:08:57 935

翻译 DFR: Deep Feature Reconstruction for Unsupervised Anomaly Segmentation 用于无监督异常分割的深度特征重建

DFR: Deep Feature Reconstruction for Unsupervised Anomaly SegmentationDFR:用于无监督异常分割的深度特征重建类型:公开 原文:https://tongtianta.site/oss/paper_pdf/ccf44eb8-bad0-11eb-872a-00163e0d281a_ecb913b8dd2e9e210986f14a375232d3.pdfJie Yang, Yong Shi, ZhiQuan Qi杨洁,石勇,齐志权Ab

2023-02-01 16:48:04 1976

原创 pip 镜像源

pip install -i http://pypi.mirrors.ustc.edu.cn/simple/ --trusted-host pypi.mirrors.ustc.edu.cn '模块版本'pip install -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com '模块版本'

2023-01-30 17:08:30 106

原创 anaconda 常用命令

在vscode终端中激活创建的虚拟环境,从而能够调用该venv下的包,或者在vscode终端内激活虚拟环境。否则vscode将不会有输出(默认虚拟环境为base,仅选择了base自带的python才会有输出)。为了使vscode能够使用虚拟环境下安装的包和python解释器,需要在修改vscode默认的解释器。然后选择虚拟环境下的python解释器。4.环境管理 查看python版本。13.使用conda命令安装包。2.查看conda现有源。1.查看conda版本。8.切换到另一个环境。

2023-01-04 14:31:45 2069

原创 cv2.imread() 不能读取含有中文的图片路径

有时候需求会从包含中文的路径的文件中读取图片文件,尤其是一些图片为中文命名的文件。如上面的语句中,如果图片中包含中文路径则会出现读取图片为空的错误。实际上解决这种错误很简单,我们可以通过。

2022-12-30 11:28:49 1273 3

原创 《AI在工业机器视觉检测中的应用123》(1.0)一图概览 图像数据增强方式

在工业机器视觉检测中,如果使用深度学习的方式进行图像处理,需要收集大量的数据样本对检测模型进行训练。然而 由于行业内客户对数据的保密机制或者本身生产过程中出现缺陷的产品数量极少,导致缺陷样本不易收集。这也是为什么要做图像数据增强的原因。

2022-12-23 12:54:33 139

转载 18种热门GAN的PyTorch开源代码 | 附论文地址

这种模型简称AAE,是一种概率性自编码器,运用GAN,通过将自编码器的隐藏编码向量和任意先验分布进行匹配来进行变分推断,可以用于半监督分类、分离图像的风格和内容、无监督聚类、降维、数据可视化等方面。这种变体能够用两组不同域的无标签图像来训练图像翻译器,架构中的主要GAN学习将图像从域U翻译到域V,而它的对偶GAN学习一个相反的过程,形成一个闭环。最小平方GAN(LSGAN)的提出,是为了解决GAN无监督学习训练中梯度消失的问题,在鉴别器上使用了最小平方损失函数。半监督生成对抗网络简称SGAN。

2022-12-20 15:00:03 901

原创 matplotlib 基本用法

函数完成,如果修改序列以pyplot函数结束,或者如果matplotlib处于非交互模式并且修改序列以show()或savefig()结束,则不需要该选项。ax[x][y].set_xticklabels(),可以将任何其他类型的值作为标签.可以赋值给之前已经设置过的set_xtick.ax[x][y].set_xticks([0,1,2,3,4]) # 将0,1,2,3,4作为x轴刻度标签。这使您可以在交互模式下工作,并且,如果您更改了数据或格式,则允许图形本身更改。将显示您正在处理的当前图形。

2022-12-20 09:59:49 1531

原创 pip的版本在pip list 中与虚拟环境版本不一致问题

对于一般的依赖包进行安装,完全是可以忽略这个升级提示的,但就是有些依赖包必须得要最新的 pip 版本才能安装,所以没有办法,只能按照它的提示的命令进行安装,但是会出现安装失败的现象,提示安装失败。网上很多人说使用 python -m pip install -user --upgrade pip 但是我们要清楚这是使用了 用户权限,升级是升级成功了,但是升级的 pip 版本在 C 盘中,而不是在你项目目录虚拟环境中。进行安装,显示成功安装,且可以 pip -V 查看版本。最后在cmd 中重新使用命令。

2022-12-20 09:01:46 655

原创 相似向量检索库-Faiss-简介及原理

Faiss全称(Facebook AI Similarity Search)是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前较成熟的近似近邻搜索库。版权声明:本文为CSDN博主「金色麦田~」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。除此以外,对一些核心算法提供了GPU实现。它包含多种搜索任意大小向量集(备注:向量集大小由RAM内存决定)的算法,以及用于算法评估和参数调整的支持代码。

2022-12-15 10:08:10 584

原创 Grad-CAM简介-网络 热力图分析

对于常用的深度学习网络(例如CNN),普遍认为是个黑盒可解释性并不强(至少现在是这么认为的),它为什么会这么预测,它关注的点在哪里,我们并不知道。这里我们简单看下Image Classification任务,首先网络进行正向传播,得到特征层A AA(一般指的是最后一个卷积层的输出)和网络预测值y yy(注意,这里指的是softmax激活之前的数值)。版权声明:本文为CSDN博主「太阳花的小绿豆」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。接着对y c y^cy。

2022-12-15 09:57:39 1580

转载 【自动驾驶】--3D视觉感知算法

1 前言对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周围环境作出正确判断的关键。一般来说,自动驾驶车辆的视觉传感器(比如摄像头)安装在车身上方或者车内后视镜上。无论哪个位置,摄像头所得到的都是真实世界在透视视图(Perspective View)下的投影(世界坐标系到图像坐标系)。这种视图与人类的视觉系统很类似,因

2022-10-28 16:01:06 1131

转载 【计算机语言】--c++ 内存管理

随着人工智能,云计算等技术的迅猛发展,让Python,go等新兴语言流行了起来,很多人以为C++可能已经过时了,确实,C++编程语言走到今天已经有将近40年的历史了,但它依然是当今的主流语言,我们可以看一下世界权威编程语言排行榜,C++依然是属于第一梯队,C++在金融交易系统,游戏,数据库,编译器,大型桌面程序,高性能服务器,浏览器,各类编程比赛(ACM-ICPC,Topcoder,Codeforces,Google Code Jam)等领域任然是主力军。在各个大厂情况,C++也是很多大厂主力编程语言,国外

2022-10-27 16:17:19 372

MFIF-GAN的 pytorch源码+中英文论文

MFIF+多焦点图像生成+多焦点图像融合、散焦扩散效应、生成式对抗网络、深度学习 内容包括MFIF-GAN的 pytorch源码+中英文论文

2023-04-18

语义分割Unet+pytorch源码+小批量数据集+网络简图

语义分割Unet+pytorch源码+小批量数据集+网络简图 适合深度学习语义分割方向高效学习测试Unet网络

2023-04-18

python 将labelimg标注的分割数据集转换成目标检测数据集

python 将labelimg标注的分割数据集转换成目标检测数据集 适合处理分割数据集和目标检测数据集的转换

2023-04-18

python 遍历imgfilespath 下的所有图片 按名称分类保存到imgfilesSavepath下的相应文件夹下

python 遍历imgfilespath 下的所有图片 按名称分类保存到imgfilesSavepath下的相应文件夹下 适合python和深度学习新手 进行图片的分类保存

2023-04-18

halcon 创建并执行模版匹配

使用halcon 创建并执行模版匹配

2023-04-18

halcon 创建模版匹配后执行匹配,并对ROI进行仿射变换

halcon 创建模版匹配后执行匹配,并对ROI进行仿射变换 适合刚入门halcon的人群,需要使用模版匹配进行定位和相对位置的仿射变换

2023-04-18

stm32串口通讯1.docx

2016-03-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除