TU商-CSDN博客

原创 MMpretrain 中的 LinearClsHead 结构与优化

在 MMPretrain 中，：增加隐藏层提升非线性能力。：使用温度缩放和权重归一化。：添加归一化层和激活函数。

2025-07-14 20:30:00 272

原创最严重视场计算方式

为了在图像A（宽度为W，高度为H）中找到一个固定宽度为X、高度为Y的ROI（Region of Interest），使得ROI内所有矩形框的高度之和最大，可以采用一种基于矩形框中心点的扫描线算法。该方法假设一个矩形框的中心点落在ROI内时，该矩形框即被视为在ROI中，并计入其高度。这种假设简化了问题，并允许高效计算。

2025-07-09 21:00:00 823

Orange3是一个开源的可视化机器学习与数据挖掘工具，采用模块化架构实现低代码交互分析。其核心设计围绕拖拽式工作流（Widget组件+数据流连接）和即时反馈机制，底层通过SignalManager调度计算，Table对象统一封装数据。系统基于Qt框架构建，支持插件扩展（如文本/生物/图像分析），关键实现涉及信号槽通信、异步线程、设置持久化及可视化集成（Matplotlib/pyqtgraph）。贡献者可从OrangeCanvas主入口切入，重点研究Widget基类（输入/输出端口、commit逻辑）和数据

2025-07-04 20:30:00 829

原创请帮我写一个前端页面代码实现以下功能：（1）可以下拉选择ABCD四种任务（2）每种任务可以选择1，2，3，4，5 五种算法名称（3）列表中可以配置20种参数的值（都是str字符串类型（4）有启动

动态生成20个参数输入框，格式化为param01-param20。使用现代JavaScript的async/await处理异步请求。包含两个端点：/api/start 和 /api/stop。"param01": "值1","param02": "值2",使用Flask框架创建RESTful API。后端API地址（前端代码中的fetch地址）// ...其他参数。添加数据库支持（如果需要持久化存储）支持JSON数据解析和错误处理。包含完整的表单验证和错误处理。添加跨域支持（如果需要）

2025-04-21 20:30:00 335

原创 msvcrt.dll与msvcr.dll的版本对应关系

接下来的版本对应关系清晰明了：ucrtbase.dll对应MSVC++ 14.0（Visual Studio 2015），MSVC++ 12.0的msvcr120.dll，11.0的msvcr110.dll，依次回溯至VC++ 6.0的msvcrt.dll。从msvcrt.dll，这个曾在VC 5.0和6.0时代占据主导的单一文件，到后来的msvcrt40.dll，它是对早期版本的向前兼容，通过转发机制直接链接到msvcrt.dll，体现了技术的迭代与优化。而随着VC的升级，msvcrt的格局也随之演变。

2024-09-29 14:24:33 567

原创 2024工业机器视觉产业现状

为了解当前工业机器视觉产业的基本情况，总结产业特征，分析存在问题，同时挖掘工业机器视觉细分赛道更具实力与潜力的标杆企业，为机器视觉技术的大规模应用提供借鉴经验，助力推动整个产业高质量快速发展，“工业互联网世界”调研组面向工业机器视觉领域开展产业调研工作，调研在。一方面，减少对于国外技术的依赖；此外，随着生产线速度的提升，方面，工业机器视觉系统在运行过程中，需要保证安全性和稳定性，一旦出现故障，可能导致生产线停工，甚至引发安全事故，因此，如何提高系统的安全性和稳定性，是工业机器视觉领域的重要课题。

2024-09-16 15:04:41 2579 1

原创 c# 中使用 openFileDialog 打开某个文件夹后，再使用sysytem.IO.File.Exists(path)判断某相对路径失败。

原因是 openFileDialog 打开某个文件夹后会修改系统对应的当前文件夹目录，这就导致像..\\Apath\\Bfoleder\\c.txt 这种相对路径发生了变化。

2024-09-13 20:30:00 192

原创 win11 安装qt5.14.2 、qtcreator、vs编译器。用最小安装进行 c++开发qt界面

系统：win11。

2024-04-26 20:15:00 2139

原创 c++ 多线程互锁条件变量

【代码】c++ 多线程互锁条件变量。

2024-04-02 15:12:32 362

原创【AIGC大模型】2024年02月论文月总结

第一周：[Baichuan3] https://www.baichuan-ai.com/home [FAVA] https://arxiv.org/abs/2401.06855 [GPTVoiceTasker] https://arxiv.org/abs/2401.14268 [FuseLLM] https://arxiv.org/abs/2401.10491 [Lumiere] https://lumiere-video.github.io [Lumiere专题介绍] AI视频生成：Lumiere（超越

2024-02-29 21:22:26 1266

原创【AIGC大模型】InstantID 赏析

论文地址：https://arxiv.org/abs/2401.07519InstantID 主页：https://instantid.github.io/code：来自小红书的团队最近开源了InstantID项目。InstantID 凭借着高质量的图像生成能力在 GitHub 热榜上迅速飙升，成为焦点。使用 Textual Inversion、DreamBooth 和 LoRA 等方法进行个性化图像合成取得了重大进展。

2024-02-29 20:57:23 1409

原创【AIGC大模型】跑通wonder3D （windows）

先跑通开源工程代码

2024-02-25 15:48:20 2321 1

原创【AIGC大模型】Sora--首个大型视频生成模型

Sora通过分析大量的视频数据、学习物理规律的表现，并利用先进的算法理解和模拟时空连续性，从而能够生成看起来符合物理规律的视频。这一过程涉及到复杂的计算和大量的数据处理，最终使得Sora生成的视频在视觉上既真实又符合逻辑。AGI的未来或许真的不远了!

2024-02-21 21:03:43 1847 2

转载【AIGC大模型】Stable Diffusion原理详解

本文向大家介绍了图像生成领域最前沿的Stable Diffusion模型。本质上Stable Diffusion属于潜在扩散模型(Latent Diffusion Model)。潜在扩散模型在生成细节丰富的不同背景的高分辨率图像方面非常稳健，同时还保留了图像的语义结构。因此，潜在扩散模型是图像生成即深度学习领域的一项重大进步。Stable Diffusion只是将潜在扩散模型应用于高分辨率图像，同时使用 CLIP 作为文本编码器。说了这么多理论，想必大家已经迫不及待跃跃欲试了。

2024-02-07 17:27:29 489

原创 pytorch 优化训练显存方式

一般在训练神经网络时，显存主要被网络模型和中间变量占用。网络模型中的卷积层，全连接层和标准化层等的参数占用显存，而诸如激活层和池化层等本质上是不占用显存的。中间变量包括特征图和优化器等，是消耗显存最多的部分。其实 pytorch 本身也占用一些显存的，但占用不多，以下方法大致按照推荐的优先顺序。

2024-01-30 20:30:00 1507

原创 c/c++ 非托管环境和 C#/JAVA 托管环境编译的基本原理

纯C/C++的程序通常运行在一个非托管环境中，类是由头文件（.h）和实现文件（.cpp）组成，每个类形成了一个单独的编译单元，当我们编译程序时，几个基本组件会把我们的源代码翻译成二进制代码。首先是预处理器，如果在项目中有头文件和宏表达式，那么它将负责包含头文件和翻译所有的宏观表达式。接下来是编译器，它不是直接生成二进制代码，而是生成汇编代码（.s），这基本上是所有现代的非结构化语言的共同基础。然后，汇编程序把汇编代码翻译成目标代码（.o和.obj文件，机器指令）。

2023-11-29 14:49:17 1119

原创使用Windows自带远程桌面连接远程linux 桌面突然不能复制粘贴的解决办法

（1）在Windows资源管理器中关闭“rdpclip.exe”进程。（2）Win+R 输入 rdpclip.exe ,再回车。（3）重新进入远程桌面就可以复制粘贴啦。

2023-09-12 13:41:03 1506

原创 linux清除显存占用：

2023-07-16 12:41:57 821

原创 ubuntu20.0 跑 paddle ：ImportError: /opt/anaconda3/envs/paddle_pz/lib/python3.7/site-packages/paddle/

建议用代理运行，不然比较慢。

2023-07-12 15:46:37 1051 4

原创 Transformer Vit Bert 的定义，区别和联系

通过自注意力机制，ViT可以捕捉图像中不同图块之间的全局关系，并在编码器输出后接一个MLP（多层感知机）进行分类任务。它根据每个位置与其他位置的相对重要性，为每个位置计算一个权重向量，然后将每个位置的信息进行加权求和。Bert通过先对大量未标记的文本进行预训练来学习通用的语言表示，然后通过在特定任务上进行微调来适应具体任务。它们都充分利用了Transformer模型中的自注意力机制、多层感知机和编码器结构等核心概念，并在各自领域展现了出色的性能。下面我将详细讨论它们的定义、区别和联系。

2023-06-21 20:30:00 1970

原创【内存问题真的很烦人】linux内存等资源管理以及 linux内存不足解决办法

//////////////////////////////////////////////这一部分存在疑问。

2023-06-21 20:00:00 2560

原创 Pytorch init定义的网络结构层能否在forward中重复使用?

参考。

2023-05-26 21:00:00 464

原创 pytorch训练模型pth导出为onnx ，再简化onnx模型

model=torch.load("/home/shangzaixing/code/LaneNet-PyTorch-RNN/pytorch-crnn.pth")#pytorch模型加载。export_onnx_file="/home/shangzaixing/code/LaneNet-PyTorch-RNN/pytorch-crnn.onnx"#目标ONNX文件名。dynamic_axes={"input":{0:"batch_size"},#批处理变量。batch_size=1#批处理大小。

2023-05-26 20:45:00 1019

原创关于opencv-python ,torch.tensor,Numpy的width height 的顺序

ROI =Mat[初始高：末尾高，初始宽：末尾宽]高,宽,通道 =Mat.shape。height 表示Y方向。width 表示X方向。//获取图像高和宽。

2023-05-26 20:30:00 213

原创 Could not load the Qt platform plugin “xcb“

根据网上查阅的资料，可能是opencv-python的版本问题，我的是4.7.0.2 更换成4.6.0.66后问题消失了。可能是opencv4.7的版本和qt版本5.15.9不匹配？已放弃 (核心已转储)

2023-05-05 09:49:06 936

原创 svn 常用命令

Subversion(SVN) 是一个开源的版本控制系統, 也就是说 Subversion 管理着随时间改变的数据。这些数据放置在一个中央资料档案库(repository) 中。这个档案库很像一个普通的文件服务器, 不过它会记住每一次文件的变动。这样你就可以把档案恢复到旧的版本, 或是浏览文件的变动历史。

2023-04-07 14:30:34 14589

原创在Linux中使用VSCode进行PyQt开发

在VSCode中按下Ctrl+Shift+P打开“命令面板”，输入“Python”，并选择“Python: Create New Blank Jupyter Notebook”命令。在弹出的窗口中为项目命名，并在代码中导入PyQt5模块。在VSCode中按下Ctrl+Shift+X打开“Extensions”页面，搜索“Python”，并安装Microsoft的Python扩展程序。该命令将会创建一个名为“pyqt_env”的虚拟环境，并在其中安装Python 3.8版本的Anaconda。

2023-04-06 10:30:48 1124

原创在vscode中使用Qtdesigner需要进行以下步骤：

这里的“yourfile.ui”是你Qtdesigner保存的文件名，而“yourfile.py”是你想要生成的.py文件的文件名。在vscode中打开项目，并在项目中创建.ui文件（可以通过文件->新建文件来创建.ui文件）。这样你就可以在vscode中使用Qtdesigner来创建你的GUI了。使用Qtdesigner窗口创建你的GUI，保存你的文件。打开anaconda虚拟环境，确保已经安装了pyqt。在代码中导入你生成的.py文件并创建你的gui。最后在main函数中实例化你的GUI对象并执行。

2023-04-06 10:25:01 3681

转载【SVN工具使用】

最后修改的时间: 2011-07-29 17:50:31 +0800 (五，2011-07-29)版本库 UUID: da5e29f9-32f2-4640-9856-d331052c80e2。版本库根: svn://192.168.1.16/web/www.kukaka.org。查看原 svn 路径方法：svn info。最后修改的作者: yangzetao。2. 查看仓库地址 (URL)3. 更改仓库地址 (URL)最后修改的版本: 4584。如何查看原 svn 地址？

2023-03-31 10:58:44 1190

原创 ubuntu22.04 安装mmocr报错：ERROR: Failed building wheel for lanms-neo

gcc: fatal error: cannot execute ‘cc1plus’: execvp: 没有那个文件或目录 compilation terminated。只需要安装build-essential即可，作用是提供编译程序必须软件包的列表信息。cc1plus.exe是Bloodshed Dev-C++的C++针对这个报错信息，网上搜索解决办法，并没有解决问题。用于该软件对C++程序的编译功能。报错的信息的意思大概是“缺少。安装C++ 编译环境。

2023-03-31 09:30:39 838

原创《AI在工业机器视觉检测中的应用123》（1.3）目标检测问题记录

（2）降低极小目标和大目标的类间不平衡。锚框设计难以获得平衡小目标召回率与计算成本之间的矛盾，而且这种方式导致了小目标的正样本与大目标的正样本极度不均衡，使得模型更加关注于大目标的检测性能，从而忽视了小目标的检测。（3）减小数据集里面同一类别里面目标特征的差异，例如将线状特征，点状特征，椭圆状特征的异物都标注为异物，这样是错误的，可以将其分别标注为线状异物，点状异物，椭圆状异物。（1）训练和推理时将大分辨率图切割成小图（例如切割为320*320），模型输入分辨率设置为640*640，甚至更大。

2023-03-22 09:29:57 367

原创《AI在工业机器视觉检测中的应用123》（1.2）目标检测模型训练样本少的类别反而recall和AP比较高？

此外，有时候数据不平衡也会导致一些类别训练得比其他类别更好。在目标检测中，某些类别可能在真实世界中出现的频率较低，因此在训练集中也缺乏大量的样本。这种情况可能是由于样本少的类别在训练过程中得到了更多的注意和重视，从而导致模型对其表现更好。因为训练集中样本数量较少，对于这些类别来说，它们在训练时能够接收到更多的反馈信号，从而使得模型学到的特征更加准确。因此，在评估模型性能时，需要结合多个指标进行综合考虑，而不是仅仅关注单一指标。因此，在评估模型性能时，需要结合多个指标进行综合考虑，而不是仅仅关注单一指标。

2023-03-13 10:06:09 257

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

MFIF-GAN的 pytorch源码+中英文论文

语义分割Unet+pytorch源码+小批量数据集+网络简图

python 将labelimg标注的分割数据集转换成目标检测数据集

halcon 创建模版匹配后执行匹配，并对ROI进行仿射变换

halcon 创建并执行模版匹配

python 遍历imgfilespath 下的所有图片 按名称分类保存到imgfilesSavepath下的相应文件夹下

stm32串口通讯1.docx

空空如也

python 遍历imgfilespath 下的所有图片按名称分类保存到imgfilesSavepath下的相应文件夹下