baidu_huihui-CSDN博客

原创【系统救援】 Ubuntu重启失败，报错：UNEXPECTED INCONSISTENCY； RUN fsck MANUALLY

请注意，运行文件系统检查通常需要卸载文件系统或在只读模式下运行。在进行文件系统修复之前，请确保备份数据，因为某些修复可能会导致数据丢失。不同的文件系统（如ext2、ext3、ext4等）有不同的 fsck 工具。无 -a 选项，因为 XFS 文件系统通常会在挂载时自动进行检查和修复。-f: 强制检查，即使文件系统看起来干净也会运行检查。-p: 自动修复，类似于 -a，但不询问任何问题。-y: 对所有问题都回答"是"，类似于 -p。-a: 自动修复文件系统，无需用户交互。-s: 打印每个块的修复状态。

2024-05-16 09:31:13 415

转载京东发布FastReID：目前最强悍的目标重识别开源库！

官方计划发布人员重识别（person re-id）,部分可见的人员重识别（ partial re-id）, 跨域人员重识别（cross-domain re-id）和车辆重识别（vehicle re-id）等众多模型。提供了针对ReID任务的完整的工具箱，包括训练、评估、微调和模型部署，另外实现了在多个任务中的最先进的模型。，其不仅对相关领域的研究有帮助，而且对工程部署有优化，在各大数据集上的评测结果惊人，其今天公布的论文。可见FastReID的实现质量很高，且其包含的各个模块的组合是十分有效的。

2024-05-10 15:46:13 37

原创 FastReID使用教程、踩坑记录

近期在尝试使用，期间对FastReID架构、损失函数、数据集准备、模型训练/评估/可视化/特征向量输出、调试debug记录等进行记录。

2024-05-10 15:23:40 618

原创无限新衣服零元购，阿里Outfit Anyone实现真人百变换装

而针对于模特相关的控制信号，在训练时，本身是输入模特图的一种抽象信号，可作为输入模特图的一个特征通道，在同一网络中，通过 Channel 维度进行信息整合，并不需要遵循 ControlNet 的设计，额外增加网络进行处理，从而一定程度简化模型结构。可以在保留服饰基本 ID 的基础上，显著提升服饰的材料质感，模特的皮肤真实度。因此，作者提出了一种新的支持试衣功能的条件生成网络，实现服饰的形变，光照的变化，服饰新视角变化情况下的生成，同时能够保持服饰的纹理，版型，细节的一致性。

2024-04-26 16:42:37 869

原创 yolov8源码安装

YOLOv8 是目前最新的 YOLO 模型版本，但是请注意，在撰写本回答时（2023年），YOLOv8 可能尚未发布或者还在开发中。YOLO 模型通常需要 Pytorch 框架，你可以使用 pip 来安装： pip install torch torchvision。如果 YOLOv8 还未发布或者有重大变化，请参考最新的官方文档和源代码。如果在克隆仓库或安装依赖时遇到问题，请检查 YOLOv8 的官方文档或仓库以获取最新的安装指南。安装 YOLOv8 的依赖项。

2024-04-26 11:30:42 228

原创 Python格式化输出%.2f%%，是什么意思

Python格式化输出%.2f%% 是什么意思。%.2f 表示浮点数保留2位小数。起到转义的作用，使结果输出百分号。%% 表示输出一个%号，

2024-04-26 11:03:41 262 1

原创 missing 1 required positional argument: ‘self‘

这个错误通常发生在Python中使用类方法时，你没有正确地使用self参数。在Python中，实例方法必须至少有一个参数，通常被命名为self，它代表实例本身。当你在类中定义一个方法时，Python会自动将这个self参数加入到方法参数列表中。如果你是在类外部调用这个方法，并且你确信不需要一个实例（比如这个方法是静态的），那么你应该将这个方法标记为。确保你在类的方法定义中使用了self参数，并且在调用这个方法时不需要显式地传递它。，这样Python就不会自动添加self参数。

2024-04-25 16:49:18 269 1

转载开源版Gemini诞生！全能多模态模型Emu2登热榜，多项任务刷新SOTA

Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型，在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。相较2023年7月发布的第一代「多模态to多模态」Emu模型，Emu2使用了更简单的建模框架，训练了从编码器语义空间重建图像的解码器、并把模型规模化到37B参数实现模型能力和通用性上的突破。基于几个例子，模型可以照猫画虎的完成对应理解和生成任务。

2024-04-21 10:20:02 21

原创 Ubuntu使用gparted图形化工具扩容分区

请注意，扩展分区之前请确保备份重要数据，并确保没有运行正在写入数据的服务。如果是生产环境，请考虑使用更安全的方法，如使用。确认足够的未分配空间（通常是新的物理磁盘或已有磁盘上的未分配空间）。中，选择你想要扩展的分区，右键点击并选择“Resize/Move”。（对于ext3/ext4文件系统）。拖动滑块以分配更多空间给选定分区。确认当前分区布局和可用磁盘空间。如果有必要，对磁盘进行分区，使用。点击“Apply”执行更改。ubuntu扩容分区。或resize2fs。

2024-04-08 15:30:50 242

原创 qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in “/home/.conda/envs/py39/lib/pyth

报错解释：这个错误表明Qt应用程序试图加载名为"xcb"的平台插件时失败了。xcb是X Window系统的C语言库，它允许客户端程序通过X Window系统与X服务器通信。Qt使用这个插件来在X Window系统上绘制图形用户界面。问题可能是因为：xcb插件不在指定的目录中。环境变量没有正确设置，导致Qt无法找到插件。插件可能因为缺少依赖或者是不兼容的版本而无法加载。解决方法：确认xcb插件是否存在于指定的目录中。如果不存在，可能需要安装或重新安装Qt。

2024-04-01 12:09:26 1173

转载大模型参数高效微调 (PEFT) 浅析

以上这些 PEFT 方法，都是在原来模型参数之外，添加不到原参数量 1% 的参数。在这些新添加的参数上做微调，很多时候就可以媲美全参数微调了。以我个人经验来说，LoRA 和 QLoRA 是现在比较常用的，库也很好地支持了这两种方法。像是 Adapter 以及基于 pseudo soft prompt 的一些方法比较少会用到。【一家之言，欢迎评论区交流】一些论文几篇博文解密Prompt系列3. 冻结LM微调Prompt: Prefix-Tuning & Prompt-Tuning & P-Tuning。

2024-03-26 11:06:47 173

原创 SGD优化器和Adam区别

综上所述，选择哪种优化器取决于具体任务的需求，包括计算资源、收敛速度、鲁棒性以及对超参数调整的容忍度。

2024-03-25 15:49:55 629

原创 Python学习记录(五)：图像读取

读取的图像类型是np.ndarry类型，通道顺序默认为BGR。

2024-03-18 17:11:59 288

原创 retina face

RetinaFace是一种先进的面部检测技术，它通过单阶段、多级的面部定位方法来实现高精度和效率的面部检测。RetinaFace是InsightFace项目的一部分，被认为是当前最先进的面部检测模型技术特点RetinaFace的特点包括对小比例变化具有较小的敏感性，但对大尺度变化更为敏感。它使用了大量的锚点（anchors），其中75%来自高分辨率图像层（P2），这有助于提高检测的准确性应用场景。

2024-03-18 11:40:03 749

原创 ubuntu图形界面卡住了，通过以下几种方法解决

如果以上方法都无效，可能需要考虑重新安装Ubuntu系统。

2024-03-12 19:07:23 1716

原创详解Python的切片(Slice)

2) step 为正时，如果 start 为 None，可认为 start 为0，如果 stop 为 None，可认为 stop 为 len(m)；step 为负时，如果 start 为 None，可认为 start 为 -1，如果 stop 为 None，可认为 stop 为 -1-len(m)2) 如果 start 或 stop 为 None，根据 step 不同将其替换为 m 的边界，比如 start==None and step>0，将 start 替换为 0。step 为负时，从右向左找元素。

2024-03-12 13:52:05 659

原创 YOLOv9来了：实时目标检测新SOTA，完胜各种轻量或大型模型！

在此前已有方法中，性能最好的是用于轻型模型的YOLO MS-S、用于中型模型的YOLO-MS，用于普通模型的YOLOv7 AF和用于大型模型的YOLOv8-X。总结就是与现有方法相比，作者提出的YOLOv9在各个方面都有了显著的改进，PGI的设计使其可以用于从轻量到大型的各种模型。与YOLOv7 AF相比，YOLOv9-C的参数减少了42%，计算量减少了21%，但实现了相同的AP（53%）。YOLOv9的第二个贡献是设计了一种新的基于梯度路径规划的轻量级网络架构GELAN，用于证明PGI的有效性。

2024-03-08 19:51:45 336

原创 Ubuntu20.04 创建新的用户

Linux支持多个用户进行操作的，这样提高了系统的安全性，也可以多人共用一个系统，不过要注意的是系统中安装的软件相关路径，如果全部安装到了某个用户下，则另一个用户是不可以使用的。如果安装在了/opt/文件下，另一个用户可以使用的。如果安装到了某个用户目录下，则不可以使用。通过sudo命令创建新的用户，然后输入新用户的密码后，出现用户的相关信息，可以一路回车到确认系统信息，输入y，完成创建。$ sudo deluser --remove-home UserName #删除的时候，删除用户的主目录。

2024-03-08 14:40:03 565

原创 python中[:,2] , num[:, :2] ,num[:, 2:]是什么意思

这是numpy的切片操作，一般结构如num[a:b,c:d]，分析时以逗号为分隔符，逗号之前为要取的num行的下标范围(a到b-1)，逗号之后为要取的num列的下标范围(c到d-1)；如果是这种num[:b,c:d]，a的值未指定，那么a为最小值0；如果是这种num[a:,c:d]，b的值未指定，那么b为最大值；# 按步长为2取第二维的索引0到末尾之间的元素，也就是第一列和第三列。arr[:,:1] # 取第0列的数据，以。arr[:,0] # 取第0列的数据，以。arr[i, :] #取第i行数据。

2024-03-08 10:31:55 496

原创通俗理解TP、FP、TN、FN

虽然学了很多遍，但还是经常弄混这几个概念。实在是太绕了，真真假假，假假真真。归根到底，其实是没有正确理解两个标志位的含义。

2024-03-06 16:25:23 915

原创【无标题】

原因是缺少cairo包，运行。

2024-03-05 18:09:40 133

原创 src/pycurl.h:170:13: fatal error: openssl/crypto.h: 没有那个文件或目录

fatal error: openssl/ssl.h: No such file or directory “错误解决。要解决这个问题，你需要安装 OpenSSL 开发包，执行以下命令进行安装，然后重新编译即可解决。CentOS系统执行以下命令。Ubuntu系统执行以下命令。

2024-03-05 17:48:37 78

原创 SuperPoint和SuperGlue 的算法介绍及学习应用经验分享

假如求得的距离是所在行所在列的最小值，那么就认为这组点匹配，判定为。相乘相加的结果是最小值，这样看就和求解运输问题是一回事了。二范数：它表示为向量中各个元素的平方和的平方根。用神经网络，对特征子学习，比手工提取更好。描述子（坐标，描述周围信息的特征向量）的算法介绍及学习应用经验分享。特征点匹配，为了计算位姿。是模拟不同相机视角的变化。运输问题建模求解匹配问题。自监督，不需要手动标点。编码器解码器结构，好用。注意这个矩阵不是对称的。最终的目标是距离矩阵。

2024-03-04 15:37:07 228

原创 Stable Diffusion 一句话生成视频！本地运行，最稳定的方法！

1.下载最新版的 Stable-diffusion ：【

2024-02-23 16:28:21 481

原创图像分割系列论文解读（一）VNet与Dice Loss

VNet网络的左侧可以看作是不同的阶段（stage），每个阶段由1-3个卷积层对不同分辨率的特征图进行操作，卷积后特征图通道数量将会增加。网络的最后一层采用soft-max，输出是前景和背景的概率。进入下一阶段是特征图的尺寸需要减小，这是通过2x2x2的卷积实现的（步长设置为2），具体如下图所示。从图像分割的发展来看，VNet这篇论文的核心贡献是验证了Dice Loss的有效性，当然它本身的创新点不只是Dice Loss。每个阶段的卷积采用的核是5x5x5，（这里的卷积应该是指特征图长宽不变对应的卷积）。

2024-02-22 17:29:23 1275

转载多任务合一的RetinaFace: Single-shot Multi-level Face Localisation in the Wild

RetinaFace将信息量不同的任务统一为图像平面内的点回归任务。实验显示这些信息层级不同的任务在训练时可以相互促进。

2024-02-21 16:51:35 58

原创 llava1.5模型安装、预测、训练详细教程

注:host 0.0.0.0表示自动填充本机ip，网页将其替换本机ip即可，web server启动后会有网页ip，若在其它电脑将其0.0.0.0替换运行服务器的ip即可。若已完成权重下载，便可执行以下模型启动命令，而–model-path后面需跟模型权重路径文件，若联网能范文hugging face便可无需修改直接使用官方给定命令。最后，我额外说下，我使用4090显卡搭建，跑测试问题不大，大概16g左右吧，跑训练一张24G卡有些够呛。该文件可通过点击链接连接，也可在hugging face自行搜索。

2024-02-02 18:58:18 973

转载大规模语言LLaVA：多模态GPT-4智能助手，融合语言与视觉，满足用户复杂需求

一个面向多模式GPT-4级别能力构建的助手。它结合了自然语言处理和计算机视觉，为用户提供了强大的多模式交互和理解。LLaVA旨在更深入地理解和处理语言和视觉信息，从而实现更复杂的任务和对话。这个项目代表了下一代智能助手的发展方向，它能够更好地理解和应对用户需求。demo链接：https://llava.hliu.cc/ https://llava-vl.github.io/ 这个页面选1.6Install PackageInstall additional packages for train

2024-02-02 17:14:04 131

转载 PP-OCRv3进行OCR手写文字识别

手写体在日常生活中较为常见，无论是记笔记，亦或是手写书信，再或是现如今出现的各种电子设备也都支持手写输入，或是触摸屏输入，手写体可以说是随处可见。手写体的自动识别功能对于保存手写体的内容是极为重要的。中文汉字字符级别的类别繁多；手写体字符的书写随意性大, 缺乏规范性不同书写人书写风格多样中文汉字中存在很多相似字和易混淆的汉字对以上难点对手写体自动识别都带来了很大的挑战。

2024-02-02 15:30:51 303

转载基于PP-OCRv3的手写文字识别

PP-OCRv3的识别模块是基于文本识别算法SVTR优化。SVTR不再采用RNN结构，通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息，从而提升文本识别能力。如下图所示，PP-OCRv3采用了6个优化策略。SVTR_LCNet：轻量级文本识别网络GTC：Attention指导CTC训练策略TextConAug：挖掘文字上下文信息的数据增广策略TextRotNet：自监督的预训练模型UDML：联合互学习策略UIM：无标注数据挖掘方案详细优化策略描述请参考。

2024-02-02 12:23:30 301

转载本地部署体验LISA模型（LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA）

我下载了LISA-13B-llama2-v0-explanatory（别下这个，我当时是因为作者只发布了两个版本，才下的，后面没用上，要下就选择v1的版本，内存大的下13B，小的下7B）释放不需要的显存：在某些情况下，可能存在一些不需要的显存被占用，可以使用torch.cuda.empty_cache() 来释放不需要的显存。之前https://www.lfd.uci.edu/~gohlke/pythonlibs/也可以下载whl，现在点进去是这样的下不了了。可以尝试减小batch_size参数的值。

2024-02-02 09:27:55 91

转载 Llava-1.5v模型部署指南

Llava是开源的多模态大模型，由威斯康星麦迪逊大学的Haotian Liu等人研发并发布，论文已中2023NIPS。

2024-02-02 09:20:58 546

转载如何在 Ubuntu 中安装 Microsoft Edge 浏览器

微软终于聪明了一回，也学会了「打不过就加入」。Microsoft Edge 浏览器的 Linux 稳定版已经于 2020 年 10 月 23 日发布，并提供给使用。除了官方 Edge APT 源以外，还提供了.deb和.rpm格式的安装包。Microsoft Edge 基于 Chromium 开源浏览器引擎开发，任何现代或基于 Chromium 浏览器工作的网站、Web 应用程序或 Web 服务都可以在 Microsoft Edge 中使用。与其他流行的网页浏览器，如。

2024-01-31 14:34:33 423

原创 ValueError: attempted relative import beyond top-level package

看这篇文章如果还不会。。。请顺着网线来打我！！！镜像问题：(1)通过”import sys，sys.path.append('父目录的路径')“来改变，这种方法属于一次性的，只对当前的python解释器进程有效，关掉python重启后就失效了。

2024-01-30 16:46:57 938

转载不用梯子，GitHub也能访问并提速

GitHub加速插件顾名思义它就是一款加速GitHub下载速度的插件它可以提高Github访问速度github release、archive以及项目文件下载的加速。GitHum访问慢的原因在于域名解析那解决方案就有针对性了修改本地的hosts文件将远程DNS解析改为本地DNS解析。Github打开慢的原因其中一个原因GitHub的CDN域名遭到DNS污染无法连接使用GitHub的加速分发服务器所以国内访问速度较慢。直接下载配置好的github加速hosts文件下载完成之后直接替换本地的hosts文件。

2024-01-30 15:02:28 321

原创在Ubuntu中修改用户名可以通过以下方法实现：

以上是两种不同的实现方法，分别是使用usermod命令修改用户名和创建一个新用户并复制数据的方式。将旧用户的数据复制到新用户中：cp -R /home/旧用户名/* /home/新用户名/使用usermod命令修改用户名，例如：usermod -l 新用户名旧用户名。修改用户的主目录名：usermod -d /home/新用户名 -m 新用户名。修改用户组名，确保与新用户名相同：groupmod -n 新用户名旧用户名。方法二：创建一个新用户，将旧用户的数据复制到新用户中。退出管理员权限：exit。

2024-01-29 19:18:22 2765

空空如也

空空如也