【Domain Generalization(4)】领域泛化与文生图之 -- CDGA 跨域生成式数据增强 Cross Domain Generative Augmentation Image Classification 上的领域泛化,重点是用 LDM 来做数据增强,关键是补充了 Cross Domain (两种 Domain 之间)的数据。
【3DGS (1) 】3D Gaussian Splatting全解 (原理+代码+公式) - 笔记 Splatting 是一种主动的**体渲染**方法,从 3D 物体渲染到 2D 平面主动: 计算出每个发光粒子**如何影响像素点**Ray-casting 是被动的(NerF)计算出每个像素点受到发光粒子的影响来生成图像在这个3D高斯渲染的上下文中,发光粒子指的是3D空间中的点每个点都具有一定的属性(如颜色、不透明度等),可以影响最终渲染图像上的像素。这些"发光粒子"可以理解为**空间中的采样点在Splatting方法中,主动计算每个粒子如何影响2D平面上的像素。
【Domain Generalization(3)】领域泛化与文生图之 -- QUOTA 任意领域中的生成物体的数量可控 任务是文生图,重点在生成图像中物体数量的准确性/可控性。关键是 Any Domain,在两阶段(不同 Domain) 的数据上对新增的 token 优化/训练,实现领域泛化。
【踩坑记录❌】ubuntu 安装 NVIDIA 显卡驱动不要 autoinstall 背景在 ubuntu 22.04 安装 NVIDIA 显卡驱动参考了 博客 的步骤进行,发现有很多评论也出现了无法联网的情况后续解决尝试了网卡驱动下载的各类方法,安装驱动的过程中又缺失内核头、 gcc 编译器等文件。由于没有网络,每次缺失的文件只能从另外一台同为 ubuntu 22.04 的电脑上下载,通过 u 盘拷贝,,,来回下载 3、4次后还未解决最后还是选择重装 ubuntu 了,特此记录下,避免再次犯错😭。
【PaddleOCR 踩坑记录】FatalError: `Illegal instruction` is detected by the operating system. 卸载并安装旧版本的 paddlepaddle。输入图像后,成功输出结果🎉。
【Triton-ONNX】如何使用 ONNX 模型服务与 Triton 通信执行推理任务上-Triton快速开始 运行示例图像客户端应用程序,以使用示例 dendensenet_onnx 模型执行图像分类。要发送 dendensenet_onnx 模型的请求,请使用 /workspace/images 目录中的图像。在某些情况下,使用 CUDA 共享内存在客户端库和 Triton 之间传递张量可以显著提高性能。在某些情况下,使用系统共享内存在客户端库和 Triton 之间通信张量可以显著提高性能。
【Domain Generalization(2)】领域泛化在文生图领域的工作之——PromptStyler(ICCV23) 大规模预训练模型已观察到多种领域,其联合视觉语言空间中,文本特征可有效表示相关图像特征,且尽管存在模态差异,但存在跨模态迁移性现象,即可以使用文本特征训练分类器并使用图像特征进行推理,这为解决无源域数据的领域泛化问题提供了思路。
【Domain Generalization(1)】增量学习/在线学习/持续学习/迁移学习/多任务学习/元学习/领域适应/领域泛化概念理解 该系列是对 Domain Generalization 的学习记录,本文详细介绍了 DG 的相关概念和代表性工作。
【N 卡 掉驱动 Driver 】NVML ERROR: Driver Not Loaded 根据个人情况搜索后,选择最新的 Driver 进行下载,如果希望直接通过命令行下载,可以复制该按钮的链接地址。通过 wget 进行下载。这将启动NVIDIA驱动程序安装程序,可以按照屏幕上的指示完成安装。本文是直接无脑 Yes 到底。为了使更改生效,需要更新系统的模块依赖并重新加载udev规则。这将阻止Nouveau驱动加载,并确保NVIDIA驱动可以控制显示器。重启后用 nvitop 就正常啦🎉🎉🎉。保存文件并退出编辑器。
【Tailscale 重连 client】 This machine’s key expired xx minutes ago and needs to be reauthenticated. 【代码】【Tailscale 重连 client】 This machine’s key expired xx minutes ago and needs to be reauthenticated.
【vs code(cursor) ssh连不上服务器(3)】无法连接到远程扩展主机服务器 (错误: CodeError(AsyncPipeFailed(Os { code: 2, kind: NotF 将 vs code ssh 插降级到0.107.1(安装特定版本),并关闭自动更新,终于在 vs code 上正常连接上服务器了😭🎉。注意,最好同时也关闭 vs code 的自动更新,因为服务器那边的 vs code 不会自动更新,可能也会出现不匹配版本的问题。大概率可能是 vs code 插件自动更新,导致不能连接上版本太老的 OpenSSH / OpenSSL?发现服务器3 的 OpenSSH 和 OpenSSL 比较老!
模型权重文件总结: .bin、.safetensors、.pt的保存、加载方法一览 bin.pt.pth:这些格式大多数情况下保存的是state_dict,需要通过将其加载到模型中。完整模型 (.pt:保存的是整个模型对象,包含模型架构和权重,加载时直接得到模型实例。:专为安全和效率设计,需要库处理加载和保存。
【Flux 拆解(1)】CLIP 和 T5 的 Tokenizer 异同 本系列将以 Flux-dev 为例,详细拆解各个部分的细节和重点。Flux 整体框架图如下,来源于: 《Stable Diffusion 3「精神续作」FLUX.1 源码深度前瞻解读》
【HuggingFace 如何上传数据集 (3) 】Dataset-稳定上传与下载大量(上万)图片等格式的数据 【HuggingFace 如何上传数据集】快速上传图片、文本等各种格式的数据可能遇到网络不稳定的情况。【HuggingFace 如何上传数据集 (2) 】国内网络-稳定上传图片、文本等各种格式的数据可能遇到传输限制文件数量不能超过 10000 条的情况。本文则通过 datasets 库来进行大量的图像数据上传。
【HuggingFace 如何上传数据集 (2) 】国内网络-稳定上传图片、文本等各种格式的数据 上文的方法因为是 https 协议,在国内很容易遇到不稳定、中断等可能性,为了保障能稳定上传,推荐还是使用 ssh 协议来传输。
【wandb】FileNotFoundError + Timed out waiting for wandb service to start after 30.0 s 在 python 主程序中设置 wandb 的可以参考官方论坛中的方法: https://community.wandb.ai/t/how-to-increase-service-wait/5418。说明问题应该就是 deepspeed 和 wandb 之间的网络通信出现了一定的问题,或者就是网速比较慢,需要更长的等待时间。由于本文的情况是在 accelerator 直接 log_with 中登录的 wandb,如下所示。因此,只需在命令行中尝试增加等待时间即可。再仔细往上溯源,发现真正的错误其实是在。