暗巷提灯-CSDN博客

原创微博图片爬取 & cookie获取方式

在图中可以看到很多list，这些就是通过下滑页面不断刷新出来的。里面的内容在Response中，要看具体加载出来的图片可点击上面的img，里面可以查看图片的content-length。（如果加载不出来可以刷新页面）2 请求图片地址，进行下载（下载分两种方式，一直是直接放进内存然后整个下载，但是这种方式在文件很大的时候内存可能会溢出，所以可以用注释部分代码，快下载，这种方式可下载各种格式图片，包括动图）黄色部分就是所需要的cookie，但是cookie会定期刷新，有可能失效了，失效了重新获取一下就行。

2025-07-02 11:40:23 234

原创编译detectron2时显示note: This error originates from a subprocess, and is likely not a problem with pip.

首先降cuda版本为11.8 （记得更改软链接，这里的cuda版本是指driver cuda）

2025-05-06 18:26:05 491

原创 Pycharm专业版中现存conda环境和python环境的加载问题

注意有些人选择Script下的conda.exe点不了ok有可能是因为版本不兼容。

2025-03-29 11:35:33 207

原创服务器环境迁移

conda环境：使用导出配置并在目标机器上创建相同的环境。pip环境：使用pip freeze导出依赖并在目标机器上重新安装。Docker容器：使用 Docker 创建可移植的环境镜像，便于在不同机器上运行。直接复制虚拟环境：使用rsync或scp将虚拟环境直接复制到目标服务器。选择方法取决于你希望如何迁移环境以及你的需求。如果你需要完全的一致性并且有很多依赖，使用 Docker 容器可能是最好的选择。

2025-03-12 10:04:23 908

原创多模态模型在做选择题时，如何设置Prompt，如何精准定位我们需要的选项(单个or多个）

注意：在一些推理能力不强的模型中（例如 Qwen2-base-7B），可能会遇到输出依然不遵循prompt的回答，这是正常的。最终，我们可以借用字典去匹配对应情绪即可。

2025-03-06 19:08:25 491

原创 python绘制图像无法显示中文汉字

【代码】python绘制图像无法显示中文汉字。

2025-02-26 19:06:53 230

原创 HuggingFace包下载脚本

在命令行用这个命令export HF_ENDPOINT=https://hf-mirror.com。然后写个python下载的脚本。

2025-02-23 14:43:56 196

原创一行代码解决hf无法访问下载权重的问题

终端输入：export HF_ENDPOINT=https://hf-mirror.com 即可。

2025-02-23 14:00:54 146

原创服务器释放screen资源（Detached状态并不会释放资源）

你可以使用screen -S <会话ID> -X quit来关闭单个会话，或者使用来批量关闭所有screen会话。一旦关闭会话，screen资源就会被释放，GPU 和其他系统资源也将得到释放。

2025-02-21 13:33:20 483

原创学习率余弦衰减

【代码】学习率余弦衰减。

2025-02-16 23:08:41 125

原创为什么dataloader出来batchsize为8，进入到model之后就变成了2

【代码】为什么dataloader出来batchsize为8，进入到model之后就变成了2。

2025-02-16 21:11:36 207

原创 F1直观上代表什么？

【代码】F1直观上代表什么？

2025-02-09 13:29:43 962

原创向量之间的各种距离详解

在计算距离或散度时，每个指标的意义和大小范围有所不同。希望这些解释能帮到你！

2025-02-05 00:44:24 1111

原创一句话概括自监督、半监督、无监督之间的本质区别

自监督是从已有数据的某个部分作为伪标签（例如完形填空、遮掉一部分图片），本身数据是不具有任何标签的，而半监督本身就是具有有标签数据的，无监督是从数据本身找出隐藏的结构或模式，在过程中不需要有伪标签。

2025-02-01 23:55:39 135

原创 Pycharm远程连接服务器，如何让Pycharm关闭时任务继续执行

创建一个新的screen会话。Ctrl + A然后按D：分离当前screen会话，任务在后台继续运行。：重新连接到一个指定的screen会话。screen -ls：查看所有活动的screen会话。通过使用screen，你可以确保远程任务在断开连接后继续运行，并且可以随时恢复会话查看任务的状态。这对于长时间运行的任务特别有用。

2025-01-21 10:23:47 984

原创实时代码交互！实现autodl与Pycharm专业版连接（跳过Gateway）

1 实现本地Pycharm与autodl连接Username、Host 和 Port 按照如下指示填写即可点击Check Connection and Continue进行进行测试连接（会有连接成功提醒），成功后便可以退出。2 实现代码的交互（代码同步）

2025-01-10 17:27:59 1537

原创安装cuda 、torch、torchvision

整体思路为先根据 nvidia-smi 指令看看自己的cuda版本，然后安装对应的cuda驱动对应关系表如下：cuda版本号查询接着，根据安装的cuda以及python版本，安装对应的torch，cuda、python与torch对应版本号如下：python、torch和cuda对应版本号然后就可以安装torchvision了：python、torch和torchvision对应版本号

2024-12-08 12:57:07 855

原创万物可爬（以爬取浏览器井盖图片和豆瓣电影名字为例）

点击F12 并选中其中一张图片，得到它的信息。2 [^>]* 匹配非>的任意多个字符（为了不匹配到结尾）4 alt="井盖图片的图像结果" 进行元素限制。3 src="(.*?)" 进行非贪婪匹配。缺陷：不能匹配划页元素和翻页元素，待完善。1

2024-12-05 12:42:13 565

原创删除Latex伪代码中标题Algorithm后面的编号和代码中的行编号

将 \usepackage[linesnumbered,ruled,vlined]{algorithm2e}在\begin{algorithm}之前加 \renewcommand{\thealgorithm}{}改成 \usepackage[ruled,vlined]{algorithm2e}

2024-11-30 19:54:03 370

原创安装与当前环境适配的包（不发生冲突）

【代码】安装与当前环境适配的包（不发生冲突）

2024-11-16 17:38:07 149

原创对正弦余弦位置编码的理解与应用（卷积方式与原特征融合）结合代码

代码实现了二维位置编码，该编码通过sin和cos函数生成一个带有位置信息的三维张量(D, H, W)。这种位置编码的思想源于模型，旨在将位置信息添加到特征中，使模型能够识别每个位置的绝对位置，从而更好地捕获空间关系。以下是对每一部分代码的详细解析及示例。

2024-11-14 23:35:14 608

原创理解多类别热力图&&热力图绘制代码（易用，可快速选择类别）

颜色越深：表示该类别的概率越高，即模型对该类别的置信度越高。不同类别可以分别绘制热力图：每个类别的概率图可以单独绘制成一张热力图，以便观察该类别在图像中的分布情况。多类别混合显示：可以通过颜色映射的方式，将多个类别的概率分布叠加在一起，以不同颜色表示不同类别的置信度分布。

2024-11-14 22:37:41 801

原创在卷积神经网络中真正占用内存的是什么

模型参数：权重和偏置。中间特征图：每一层的输出。激活值：每一层计算出的激活值。梯度：反向传播计算的梯度。优化器状态：如 Adam 等优化算法中的额外状态信息。输入数据：训练时加载到内存中的输入数据。其他辅助数据：如模型的元数据和层的配置。这些部分决定了模型在训练和推理过程中的内存占用，尤其是在训练时，随着网络深度、批次大小和模型复杂度的增加，内存消耗会显著增加。

2024-11-13 09:23:28 932

原创 RT-Tread操作系统单核调度和多核调度关键代码解读

如果线程没有绑定到特定核心或者绑定到当前核心，则允许当前核心继续运行这个线程，否则会根据核心绑定状态将线程插入到其他核心的就绪队列。这段代码为跨核切换奠定了基础，使得调度器在多核环境中可以安全地操作线程状态并进行跨核调度。在这份代码中，有几部分代码最能体现 RT-Thread 的多核调度特性，尤其是多核环境下的任务分配和上下文切换。在多核调度中，这个函数可以根据需要切换到不同核心的就绪线程，确保多核环境下任务的高效执行。通过这些步骤，代码确保了在多核环境下，最高优先级的线程能够在正确的核心上运行。

2024-11-11 23:34:44 1363

原创如何利用bibtex在Latex中添加参考文献

所以我们可以在当前tex文件同目录下新建一个Cite.bib 然后把bib文件格式放入即可。编辑Cite.bib文件用WinEdt较为方便。在\end{document}前面添加。第二行表示从哪里得到文献库。第一个行表示文献的板式。以IEEE格式为例子。

2024-11-11 10:22:59 261

原创 SGD学习器和Adam学习器之间的区别与关系

（随机梯度下降）和（Adaptive Moment Estimation）是两种常用的优化算法，在训练神经网络时，它们都用来最小化损失函数并更新模型参数。尽管它们有相似的目标，但在更新规则和效率上有所不同。

2024-11-06 08:32:45 1690

原创自我优化（如编码器解码器架构）过程能用EMA方法吗

模型在“自我优化”过程中也可以使用 EMA 方法。通过 EMA 方法更新自身参数，模型可以更平稳地改进，而不受单次更新带来的噪声影响。这种方法通常在半监督学习、自监督学习或强化学习中非常有效，因为它可以帮助模型在优化过程中保持稳定，并且在模型推理阶段提供更稳健的表现。

2024-10-31 11:19:45 406

原创教师学生模型是怎么通过EMA机制来优化两者参数的

在教师-学生模型（Teacher-Student Model）中，EMA（指数移动平均）常用于教师模型的参数更新，以增强教师模型的稳定性并帮助学生模型更好地学习。

2024-10-31 11:13:59 2023

原创利用前向勾子获取神经网络中间层的输出并将其进行保存（示例详解）

forward_hook布置了抓取函数。其中，module代表你下面勾的那一层，input代表那一层的输入，output定义那一层的输出，我们常常只使用output。这里定义了我需要捕获的那一层，layers[-1]代表我要捕获当前layers的最后一层，即上采用层，由于循环了三次，所以最后勾取的应当是三份中间层输出。

2024-10-26 23:38:08 346

原创关于CFLOW-AD论文中数学部分逻辑推理解析与代码对照

1 基本逻辑：根据论文中的阐述，我们通过编码器（encoder）是可以获得一个复杂分布z的，由于z分布复杂，不容易用来求解损失函数，所以我们通过解码器（decoder）来获取一个简单（0,1）高斯分布u，配合一个雅可比矩阵J，来代替掉复杂分布z。decoder_log_prob = get_logp(C, z, log_jac_det)得到的是公式5.2中的结果或7.2中的每一个相加的小部分。公式5.1和5.2：表示真实分布和预测分布的计算，其中预测分布计算方式已经根据基本逻辑进行了替换。

2024-10-25 19:34:37 468

原创为什么最小化负对数似然可以逼近真实数据分布(数学原理解析)

最小化负对数似然（Negative Log-Likelihood, NLL）能够逼近真实数据分布的数学原理，核心在于和，这两者紧密相关。下面通过最大似然估计的原理及其与 KL 散度的关系，解释为什么最小化负对数似然能够逼近真实数据分布。

2024-10-24 00:03:38 959

原创 VIT：论文关键点解读与常见疑问

借用BERT中的CLS思想，因为在transformer中，自注意力机制是可以是各个向量看到其他任意一个向量的，假设有196个patch，CLS就取与他们相同的长度，变成197个向量,CLS，就可以同时学到其他196个向量的信息，所以CLS身上负载了整个图片信息，最后经过MLP层进行降维就可以用来做分类任务了。利用卷积，这个块上总的像素个数就是卷积这一块patch的卷积核个数。2 转化后的这么多向量是如何用来做分类任务的？1 Patch怎么转化为向量的？

2024-10-19 21:38:33 969

原创 BERT论文关键点解读与常见疑问

BERT 可以作为生成模型的编码器，编码输入序列的信息。生成能力差：BERT 的设计主要是为了解决自然语言理解任务，而不适合自然语言生成任务（如文本生成、翻译等），这是由于它的双向性编码和 MLM 任务无法进行自回归生成。：通过这种架构，研究者可以在各种 NLP 任务上复用 BERT 的预训练模型，不需要为每个任务从头开始训练模型，大大减少了时间和资源的消耗。传统的语言模型（如 GPT）是单向的，即只能从左到右或从右到左考虑上下文，BERT 的双向性让模型能够更深刻地理解句子中每个词的含义。

2024-10-19 21:29:15 849

原创 IEEE GRSL投稿历程分享

本人为本科生，在投这本期刊时已经经历了三次拒稿（两次RS，一次GRSL），被RS拒稿意料之中，因为工作量并不是特别大，所以写得比较短，再加上开始时经验比较少，所以被拒稿。GRSL在23年之前是二区，但到24年之后降为了三区，个人感觉很大一部分原因在于它是短刊吧，另一方面，遥感方向的好的期刊也越来越多。投稿经验：论文创新点要求较高，实验量要求较低，如果能拿到大修，对每一条修改意见进行认真回复，中稿不太成问题（我是收到了三位审稿人共近40条意见，光word就写了满满17页，最后也是被三位审稿人一致ac）

2024-09-28 19:21:39 2921 9

空空如也

空空如也