纳兰小熊-CSDN博客

原创相机模型--CMOS和CCD的区别

2. 每个像素上的电荷被依次“耦合”并传输到芯片的角落，通过一个或几个模拟输出放大器输出；：由于集中输出、工艺成熟，具有较低的固定图案噪声（FPN），图像质量均匀性好；：长时间曝光或高温下会出现暗电流噪声（热噪声），传输过程存在电荷损失。：每个像素都有放大器，存在固定图案噪声和偏移误差，图像一致性相对较差；3. 所有像素电荷需依次转移，读取时间较长，但信号一致性高。2. 电荷在像素内被直接转换为电压，随机访问任意像素；：读取速度快，可动态调整曝光时间，实时处理方便；2. 电荷直接在像素内转换为电压信号；

2025-04-19 16:04:20 442

原创 C++/Python实现RGB和HSI相互转换

2--Python版本。

2025-04-19 11:05:00 217

原创 Python笔记--解决json.loads()导入含有多个引号的字符串的报错

【代码】Python笔记--解决json.loads()导入含有多个引号的字符串的报错。

2025-03-05 16:35:24 251

原创 MySQL笔记--多表查询

多表查询存在笛卡尔乘积的问题，可借助where语句实现多表查询；在任意一方加入外键，关联另外一方的主键，并且设置外键为唯一的（对于联合查询，多张查询表的列数必须一致，字段类型也要保持一致。联合查询：将多次查询结果合并，形成一个新的查询结果集。连接查询：内连接、外连接、自连接；左外连接查询左表的数据，右外连接查询右表的数据；自连接查询可以是：内连接查询和外连接查询；在多的一方建立外键，指向一的一方的主键；外连接可分为：左外连接和右外连接；自连接：查询一个表格的关联数据；内连接查询的是两张表。

2024-12-15 21:32:48 388

原创 Linux笔记--基于OCRmyPDF将扫描件PDF转换为可搜索的PDF

添加--force-ocr。

2024-11-25 21:27:07 689 1

原创 DL笔记--基于Mnist数据集测试Mixup数据增广策略

10epoch：97.56%→97.87%，提升0.31%20epoch：98.07%→98.27%，提升0.20%

2024-11-04 21:52:17 185

原创 Pytorch笔记--RuntimeError: NCCL communicator was aborted on rank 3.

从默认的30min，延长至其他时间：torch.distributed.init_process_group(backend='nccl', init_method='env://',超时错误，原因可能是CPU线程忙碌（服务器CPU资源不够），导致数据长时间加载不了，从而出现了超时bug。例如减少数据加载的线程（降低num_workers），避免由于CPU线程不足导致的超时问题。

2024-10-26 18:58:18 1520 1

原创 HAR笔记--kinetics-400数据集下载和简单处理代码

【代码】HAR笔记--kinectis-400数据集下载和简单处理代码。

2024-10-04 18:08:43 809

原创 HAR笔记--事件相机（event camera）数据常见处理方法总结

将events按时间戳累积到不同通道内。1--代码和数据参考。

2024-10-03 21:19:40 1592 1

原创 DeepSpeed笔记--利用Accelerate实现DeepSpeed加速

4-1--创建accelerrate配置。# 安装accelerate。# 获取默认配置文件。# 查看环境是否配好。

2024-09-28 21:51:44 1170

原创 Python复习笔记--正则表达式的常用方法总结

指的是：模式串不使用特殊字符来匹配字符串，而采取完整的字符子串进行匹配，其在使用findall()进行查询时会返回完整的字符子串。等）来匹配字符串，其在使用findall()只会返回起始字符和结束字符之间的字符串。3-1--re.IGNORECASE忽略大小写进行匹配。3-2--re.ASCII只匹配ASCII字符。2--findall()隐式和显式匹配字符串。3-3--re.DOTALL连同\n一起匹配。1--常用特殊字符总结。1--常用特殊字符总结。3--常用匹配常量总结。

2024-09-28 17:32:30 228

原创 Python复习笔记--列表推导式、生成器表达式、字典推导式和lambda表达式

4--lambada表达式。

2024-09-22 10:12:49 162

原创 Pytorch复习笔记--pytorch常见交叉熵函数的实现

计算公式如下：Loss(x,class)=−log(ex[class]∑iex[i])=−x[class]+log(∑iex[i])Loss(x, class) = -log(\frac{e^{x[class]}}{\sum_{i}e^{x[i]}}) = -x[class] + log(\sum_{i}e^{x[i]})Loss(x,class)=−log(∑iex[i]ex[class])=−x[class]+log(i∑ex[i])代码实现如下：2. nn.BCELoss()计算公式如下

2024-09-20 15:37:29 811

原创 AIGC笔记--DiT源码剖析

【代码】AIGC笔记--DiT源码剖析。

2024-07-29 20:05:55 378

原创 AIGC笔记--Classifer Guidance的代码理解

1--完整可debug代码。1--完整可debug代码。

2024-07-17 14:04:59 377

原创 AIGC笔记--基于Stable Diffusion实现图片的inpainting

3--基于Diffuser进行调用。

2024-07-15 11:30:09 735

原创 AIGC笔记--Stable Diffusion源码剖析之DDIM

以论文《High-Resolution Image Synthesis with Latent Diffusion Models》开源的。以文生图为例，剖析SD中DDIM的核心组成模块。本质上SD的DDIM遵循论文。为例，剖析Stable Diffusion经典组成部分，巩固学习加深印象。

2024-07-04 15:27:23 727

原创 AIGC笔记--U-ViT的简单代码实现

【代码】AIGC笔记--U-ViT的简单代码实现。

2024-06-26 17:40:53 348

原创 AIGC笔记--Stable Diffusion源码剖析之UNetModel

在 Forward() 中，使用 self.input_blocks 将输入噪声进行分辨率下采样，经过下采样具体维度变化为：[B*2, 4, 64, 64] > [B*2, 1280, 8, 8]；x 表示随机初始化的噪声Tensor（shape: [B*2, 4, 64, 64]，*2表示使用Classifier-Free Diffusion Guidance）。与Module1和Module2的结构相同，都由一个ResBlock和一个SpatialTransformer组成，只有特征维度上的区别；

2024-06-07 16:36:10 1292 1

原创 AIGC笔记--Stable Diffusion源码剖析之FrozenCLIPEmbedder

以论文《High-Resolution Image Synthesis with Latent Diffusion Models》开源的。为例，剖析Stable Diffusion经典组成部分，巩固学习加深印象。在具体使用中，会利用上述代码生成。来预测无条件噪声和有条件噪声。

2024-06-06 20:19:06 540

原创 AIGC笔记--SVD中UNet加载预训练权重

2. 加载LoRA（.safetensors）1. 加载全参数（.ckpt）

2024-06-04 11:08:34 662

原创 AIGC笔记--DDIM的简单实现

【代码】AIGC笔记--DDIM的简单实现。

2024-06-03 00:08:55 629

原创 AIGC笔记--MoE模型的简单实现

每个专家网络模型往往是独立的，且分别用于不同的问题；第二部分是门控网络，用于确定使用哪些专家网络模型，一般通过计算每个专家网络的分数（权重）来实现。MoE模型的核心组成有两部分：第一部分是多个。），其主要将多个专家神经网络模型组合成一个更大的模型。

2024-06-02 23:22:36 493

原创 AIGC笔记--基于PEFT库使用LoRA

核心公式是：new_weights = origin_weights + alpha* (BA)固定原始层，通过添加和训练两个低秩矩阵，达到微调模型的效果；4--权重保存和合并。

2024-05-28 16:21:39 1962

原创 AIGC笔记--基于Classifier-Free Diffusion Guidance的Conditional Diffusion

【代码】AIGC笔记--基于Classifier-Free Diffusion Guidance的Conditional Diffusion。

2024-05-17 22:33:19 440

原创 AIGC笔记--Diffuser的训练pipeline

1--简单训练pipeline。1--简单训练pipeline。

2024-05-09 22:57:49 615

原创 AIGC笔记--Diffuser的基本使用

来加载预训练模型，使用参数。来指定下载模型的存储地址；

2024-05-03 00:20:54 1112

原创 linux笔记--tmux的使用

【代码】linux笔记--tmux的使用。

2024-04-29 11:22:02 460

原创 Pytorch复习笔记--分布式训练代码样例

【代码】Pytorch复习笔记--分布式训练代码样例。

2024-04-15 20:09:34 349

原创手撕算法笔记--手撕交叉熵损失函数和对比学习InfoNCE loss

其中，y_pred表示模型预测的概率值，y_true表示真实的类别标签。其中，N表示batchsize的大小，M表示类别的个数。1-1--二元交叉熵。1-2--多元交叉熵。

2024-03-27 21:12:01 1671

原创 AIGC笔记--关节点6D位姿按比例融合

6D位姿一般指平移向量和旋转向量，Maya软件中关节点的6D位姿指的是。

2024-03-14 17:20:12 555

原创 AIGC笔记--Maya提取和修改FBX动作文件

通过第2步的脚本可以提取人体运动的关键6D坐标数据，这些6D坐标数据可以进行一些动作生成任务，生成相同意义的坐标数据。对于一个固定的人体模型，修改每一帧中各个关节点的上述六个坐标，即可改变人体表现的动作；对于上图来说，平移X、平移Y和平移Z表示关节点的。的坐标，而旋转X、旋转Y、旋转Z表示关节点的。在一个原始FBX文件中对应于Maya可视化的。3--6D数据映射和Maya可视化。2--FBX SDK导出6D数据。1--Maya数据解析。1--Maya数据解析。

2024-03-11 10:30:55 798 2

原创 AIGC笔记--条件自回归Transformer的搭建

1. 自回归 TransFormer 规定Token只能看到自身及前面的Token，因此需生成一个符合规定的Attention Mask；（代码提供了两种方式自回归Attention Mask的定义方式）；2. 使用Cross Attention实现条件模态和输入模态之间的模态融合，输入模态作为Query，条件模态作为Key和Value；

2024-03-06 20:38:00 433

原创 Conda笔记--移动Conda环境后pip使用异常的解决

由于各种原因，需要将Anaconda转变为Minicoda，为了保留之前安装的所有环境，直接将anaconda3/envs的所有环境拷贝到Miniconda/envs中，但在使用移动后环境时会出现pip的错误：bad interpreter: No such file or directory。报错原因：移动环境后，对应pip的路径没有进行相应修改。解决方法：修改对应环境bin/pip的路径。

2024-03-04 14:58:48 1088

原创 AIGC笔记--GAN模型的搭建

很多时候会出现以下问题：1. 生成器的损失会上升而辨别器的损失会下降，或者是生成器的损失会下降而辨别器的损失会上升；训练生成器时，使用噪声作为生成器的输入生成噪声图片，将噪声图片输入到辨别器进行判断，并设置此时的训练标签为1，通过欺骗辨别器来训练生成器，企图让生成器的输出更接近真实的图片。训练辨别器时，使用分别使用噪声图片和真实图片作为辨别器的输入，噪声图片对应的训练标签为0，真实图片的训练标签为1，使辨别器作二分类任务来学会判断噪声和真实图片；经典GAN模型先训练辨别器，再训练生成器；

2024-03-04 11:32:54 328 2

原创 AIGC笔记--特征线性调制（FiLM）层的实现

特征线性调制（Feature-wise Linear Modulation，FiLM）层是一种神经网络模块，它可以用来实现特征的条件调整。，使得模型可以根据特定的条件（例如来自其他模态的信息）来调整特征的表示。，然后对输入特征进行缩放和偏移，即y = γ * x + β。这里，γ和β是与输入特征x同样大小的向量，它们决定了对输入特征的。FiLM层的工作原理如下：给定一个输入特征x，FiLM层首先通过一个全连接层或其他形式的网络结构生成两个参数。总的来说，FiLM层是一种强大的特征调整工具，它可以帮助模型。

2024-01-18 21:45:57 6033

Sheffield大学Matlab遗传算法工具箱.zip

空空如也