qianx77-CSDN博客

原创【Ubuntu服务器烤机】

安装sensorsCPU 半个小时内存一个小时gpu半个小时make跑的时候看GPUsensors;echo;跑完看log。

2026-06-27 09:24:36 330

原创【图片压缩工具】支持原始色彩icc保留，修改exif信息

本文介绍了一款自研的图片压缩工具，专为解决个人网站图片占用存储空间和流量的问题而设计。该工具提供三种输入方式（文件夹选择、截图粘贴、拖拽）和三种压缩方案（质量压缩、尺寸调整、比例缩放）。特别支持EXIF信息修改功能，可自定义创作者、拍摄时间和GPS位置（需高德API密钥）。实测显示，90%质量压缩可减少60%以上文件大小而不影响画质。工具界面简洁，操作便捷，适合个人博客或相册使用。

2026-01-07 22:34:52 489

原创【博客】前端新手如何创建自己的个人网站相册

偶然间在GitHub看到有一个创建个人相册的项目，觉得还挺美观的。再加上自己开始慢慢有想着记录生活的习惯，特别是用相机来记录。至少可以让记忆暂时留存。至少去过某些地方，见过某些风景，虽然不多，但至少是宝贵的记忆。本人是纯纯的前端小白，只会根据AI的提示修改东西。所以想记录一下新手怎么搭建自己的个人相册还有很多不足，希望大家给下指点。

2026-01-07 22:08:20 1176 1

原创【文件共享工具】非常好用的本地网络文件共享工具！LocalSend

你是否可能会遇到这些场景LocalSend！github上截至今天，非常简单易用，但又非常强大。

2025-12-03 21:29:45 557

原创【环境配置】快速转移conda上的python环境

换主机跑代码，不想重新安装conda环境，怎么快速安装，显卡差不多的情况下，肯定是复制最快！但直接复制，需要修改一些东西，不然pip安装功能就废了。记录下。

2025-12-03 20:04:51 197

原创【环境部署】安装flash-attention

pip 安装失败，需要官方下载whl，离线安装，下载地址。

2025-12-01 22:34:48 424

原创【环境配置】Ubuntu系统安装cuda

Ubuntu系统安装显卡驱动后需要安装cuda，因为Windows下主要是界面安装（)，Ubuntu主要是命令行安装，还是有必要记录一下。

2025-11-30 15:22:43 272

原创【环境配置】micromamba替代miniconda，管理python环境

conda资源商用是需要付费的（当使用量大的时候），而micromamba是开源的，可以绕开，实现免费搭建管理python环境。记录下自己在windows上配置micromamba的过程。你会发现micromamba字母太多了，不像conda这么简洁，所以激活个命令都得敲半天键盘，既然Ubuntu中可以设置自定义快捷命令【环境配置】【linux】自定义快捷命令/脚本】，那Windows下是否也可以支持自定义更短的命令呢？答案是可以！既然相当于.bashrc，那同样可以设置自定义命令！

2025-11-30 15:13:56 1194

原创【环境配置】【bug调试】pytorch3d 安装

本文介绍了PyTorch3D库的安装方法。由于直接pip install pytorch3d会失败，提供了两种解决方案：使用conda安装(conda install pytorch3d -c pytorch3d)或通过pip安装Git仓库。重点解决了pip安装时可能遇到的"ModuleNotFoundError: No module named 'torch'"问题，这是由于pip构建隔离导致的。解决方法是在安装命令中添加--no-build-isolation参数禁用构建隔离，或者先

2025-11-27 22:28:03 488

原创【原理理解】三维重建colmap工具的输出格式

由于我的后续任务是3dgs，所以我只关注稀疏重建的内外参+密集重建的ply点云文件。

2025-11-19 22:21:37 880

原创【环境配置】三维重建工具colmap服务器(ubuntu)编译cuda版本

colmap常用于多视图重建，即利用多个相机多个视图或单个相机多个视图重建3D信息，获取相机内外参，其构建的点云是3DGS\4DGS 多视角渲染的初始化条件。但官方仅提供windows系统的cuda版本，如果linux/ubuntu要安装cuda版本用于加速重建，或密集重建，需要自己编译。由于自己在此踩了比较多的坑，因此记录一下。

2025-11-19 22:08:04 1657 1

原创【bug】diff-gaussian-rasterization Windows下编译 bug 解决

正在创建库 build\temp.win-amd64-cpython-38\Release\cuda_rasterizer_C.cp38-win_amd64.lib 和对象 build\temp.win-amd64-cpython-38\Release\cuda_rasterizer_C.cp38-win_amd64.exp。你现在这个错误说明我们虽然把 crtdefs.h 找到了，但它自己还依赖 corecrt.h，而这个文件是在 Windows SDK 里，不在 MSVC 目录下。

2025-08-11 20:26:27 1257

原创【bug、调试】SecurityError: (:) ，PSSecurityException + FullyQualifiedErrorId : UnauthorizedAccess

无法加载文件 D:\Users\y\Documents\WindowsPowerShell\profile.ps1，因为在此系统上禁止运行脚本。有关详细信息，请参阅 https:/go.microsoft.com/fwlink/?LinkID=135170 中的 about_Execution_Policies。所在位置行:1 字符: 3。

2025-08-11 20:07:43 425

原创 [bug]AttributeError: module ‘typing_extensions‘ has no attribute ‘TypeVar‘

错误“AttributeError: module ‘typing_extensions’ has no attribute ‘TypeVar’”表示typing_extensions您环境中安装的模块未公开TypeVar为属性。这通常是由于typing_extensions软件包的安装已过期或损坏造成的。要解决此问题，建议重新安装或升级typing_extensions。这样可以确保您拥有正确包含和其他必要输入功能的版本。解决此问题的步骤如下：卸载当前的 Typing_extensions 包。

2025-08-07 10:58:45 917

原创【杂项】部署deepseek本地

根据自己电脑配置安装相应版本（命令行安装）查看目前安装了哪些版本，再使用。

2025-06-08 13:20:39 334

原创【python】argparse怎么指定bool类型？

最近在写脚本的时候想要实现一个if 操作，通过用户输入。确定要不要启用某个语句。非常自然的就是使用python的argparse包，但是发现了一个陷阱，记录下。

2025-05-29 20:38:31 566

原创【论文精读】2024 ECCV--MGLD-VSR现实世界视频超分辨率(RealWorld VSR)

现实世界中的低分辨率（LR）视频存在多样化和复杂的退化现象，这对视频超分辨率（VSR）算法在高质量地再现其高分辨率（HR）对应物时提出了巨大的挑战。最近，扩散模型在图像还原任务中展现出了令人信服的生成真实细节的性能。然而，扩散过程具有随机性，使得控制还原图像内容变得困难。当将扩散模型应用于视频超分辨率（VSR）任务时，这个问题变得更加严重，因为时间一致性对视频的感知质量至关重要。在本文中，我们通过利用预训练的潜在扩散模型的优势，提出了一种有效的实际应用视频超分辨率算法。

2025-05-29 20:14:56 1620

原创【论文精读】2024 CVPR--Upscale-A-Video现实世界视频超分辨率(RealWorld VSR)

基于文本的扩散模型在生成和编辑方面表现出了显著的成功，显示出利用其生成先验增强视觉内容的巨大潜力。然而，由于对输出逼真度和时间一致性的高要求，将这些模型应用于视频超分辨率仍然具有挑战性，而这一点又因扩散模型固有的随机性而变得更加复杂。我们的研究引入了Upscale-A-Video，一种用于视频上采样的文本引导的潜在扩散方法。该框架通过两个关键机制确保时间一致性：局部上，它将时间层集成到U-Net和VAE-解码器中，保持短序列内的一致性；

2025-05-29 20:11:34 1533

原创【论文精读】2024 arXiv --VEnhancer现实世界视频超分辨率(RealWorld VSR)

我们提出了VEnhancer，这是一种生成时空增强框架，通过在空间领域中添加更多细节以及在时间领域中合成详细的运动，从而改善现有的文本到视频的结果。针对生成的低质量视频，我们的方法可以通过统一的视频扩散模型同时提高其空间和时间分辨率，支持任意的上采样空间和时间尺度。此外，VEnhancer有效地去除了生成视频中的空间伪影和时间闪烁现象。为此，我们基于预训练的视频扩散模型，训练一个视频控制网络，并将其作为低帧率和低分辨率视频的条件注入到扩散模型中。

2025-05-27 19:48:28 1368

原创【原理理解】ldm 和 diffusers 库的区别

ldm（通常指 latent-diffusion-models）文件夹和 pip install diffusers 安装的 diffusers 库在功能和应用场景上有一定关联，但也存在明显区别。

2025-05-27 19:40:12 489

原创 [原理理解] 基于diffusion的超分任务时候遇到的CLIPTokenizer和CLIPTextModel

将文本字符串转换为模型可以处理的 token ID 序列。：将 token ID 序列转换为高维度的向量表示，以便与图像表示进行比较。通过这两个组件，你可以处理文本输入并将其转换为适合 CLIP 模型处理的格式，从而实现多模态任务。

2025-05-23 20:33:05 629

原创 [原理理解] 超分使用到的RAM模型和LLAVA模型

RAM（Recognize Anything Model）是用于图像识别和描述的模型，能从图像中识别多种对象、属性和场景，并生成对应的文本标签。它基于 Vision Transformer（ViT）架构，尤其代码里用的是 Swin Transformer 作为骨干网络，在大规模图像数据集上预训练，具备强大的图像特征提取和理解能力。RAM 模型用于文本提示提取，从图像里提取文本描述，为后续图像生成任务提供语义信息。

2025-05-23 20:26:59 595

原创【论文精读】2023 CVPRW--EAVSR现实世界视频超分辨率(RealWorld VSR)

视频超分辨率（VSR）旨在从低分辨率（LR）视频重建高分辨率（HR）视频，近年来取得了巨大进展。然而，将现有的超分辨率视频重建方法应用于具有复杂退化的真实世界数据仍然具有挑战性。1、一方面，现有的与实际情况高度对齐的超分辨率视频重建（VSR）数据集较少，尤其是具有较大超分辨率缩放因子的，这限制了实际超分辨率视频重建任务的发展。2、另一方面，现有视频超分辨率方法中的对齐算法在处理真实世界的视频时表现不佳，导致结果不尽如人意。为了应对上述问题，

2025-05-23 20:21:42 1367

原创【论文精读】2023 AAAI--FastRealVSR现实世界视频超分辨率(RealWorld VSR)

循环结构是视频超分辨率任务中一种普遍使用的框架，它通过隐状态对帧之间的时间依赖进行建模。当应用于具有未知和复杂退化的现实场景时，隐含状态往往包含不愉快的伪影，并将其传播到恢复的帧中。在这种情况下，我们的分析表明，当隐状态被更干净的对应物替代时，这些伪影可以大大减轻。基于这些观察，我们提出了一种隐状态注意力（HSA）模块，以减轻真实世界视频超分辨率中的伪影。具体而言，我们首先采用各种廉价滤波器来生成一个隐状态池（pool）。例如，高斯模糊滤波器用于平滑伪影，而锐化滤波器用于增强细节。

2025-05-23 20:09:08 1159

原创【论文精读】2022 CVPR--RealBasicVSR现实世界视频超分辨率(RealWorld VSR)

现实世界视频超分辨率 (VSR) 中退化的多样性和复杂性在推理和训练中存在重大挑战。首先，虽然长期传播可以在轻度退化的情况下提高性能，但严重的野外退化可以通过传播夸大，损害输出质量。为了平衡细节合成与伪影抑制，我们发现图像预清理阶段是不可或缺的，它可以减少在传播之前的噪声和伪影。配备经过精心设计的清理模块，我们的RealBasicVSR在质量和效率上均优于现有方法（见图1）。其次，实际应用中的超分辨率（VSR）模型通常使用多样化的退化进行训练，以提高其泛化能力，这需要增加批量大小以产生稳定的梯度。

2025-05-23 20:02:28 1790

图片压缩软件，无损压缩手机照片，减少存储空间

python+opencv 读取webcamera，并显示

find-avaGPU.py

空空如也