GondorFu-CSDN博客

原创 Linux SSH 连接长时间后断线

【代码】Linux SSH 连接长时间后断线。

2025-12-26 17:02:25 100

原创国内 huggingfaces 仓下载

国内直接通过 https://huggingface.co 下载速度很慢，甚至无法下载。具体下载有多种方法，一种方式通过 snapshot_download 进行。

2025-09-29 15:37:10 256

原创 vscode 文件及模块调用方式介绍

【代码】vscode 常用调试。

2025-05-20 15:51:44 892 1

原创 python 绝对引用和相对引用

在 Python 里面，一个 .py 文件可以称为模块，包含了 __init__.py 文件夹的称为包（python3.3 之后不再要求包文件夹下必须包含 __init__.py）。当一个模块被执行时，Python 会从 sys.path 给出的路径去找在模块中引入的包或其它模块，如果找不到，程序就会报错。

2025-05-07 16:34:15 881

常量是固定值，在程序执行期间不会改变编译时常量，因此使用这个关键字可以做编译时优化，运行时性能会比const好。为一个已有的类型取一个新的名字，在复杂项目中可以提高代码可读性一个易变量。每次都需要从内存地址读取这个数据在修饰函数或者变量的时候，告知编译器该函数或变量已在别处定义，可以放心编译构建函数限制只能在本文件调用；不能在其他文件中被调用inline：编译器会将函数在调用点展开，减少了调用开销，提高了代码的执行效率；但是可能会带来代码体积的膨胀。相比较宏定义，inline。

2025-03-26 16:09:27 2466

原创基于网页信息的SFT训练数据生成

Windows安装路径在 C:\Users\用户名\AppData\Local\ms-playwright\chromium-****\chrome-win。crawl4ai依赖nodejs，playwright及chromium提供模拟浏览网页能力，需要依次安装nodejs，playwright及chromium。爬取调用逻辑：利用爬取到的doc.metadata["links"]["internal"]获取网页中的子链信息，进行迭代式深度爬取。五、基于LLM进行QA生成。

2025-03-24 08:43:31 448

原创 AutoModelForCausalLM 提示 flash_attn 未安装

解决方案：修改/home/*user_name*/miniconda/envs/*env_name*/lib/python3.10/site-packages/transformers/dynamic_module_utils.py check_imports 函数，注释对应校验部分。

2025-03-07 16:14:02 933

原创 python 代码网络受限问题

/anaconda3/envs/***/lib/python*.*/urllib/request.py 添加一下代码。2、huggingface 下载数据 ssl 验证失败。

2024-10-17 21:52:27 552

原创 DPO: Direct Preference Optimization 介绍

DPO 是 RLHF 的屌丝版本，RLHF 需要加载 4 个模型（2个推理，2个训练），DPO 只需要加载 2 个模型（1个推理，一个训练）。

2024-09-14 17:47:28 3065

原创 LLM Tokenizer 介绍

这里我们使用的是不区分大小写的 BERT 模型，因此分词后添加的普通 token [NEW_tok1] 和 [NEW_tok2] 都被处理为了小写，而特殊 token [NEW_tok3] 和 [NEW_tok4] 则维持大写，与 [CLS] 等自带特殊 token 保持一致。PS：不同的语言模型获取 embedding 的方式会有不同，需要根据模型结构进行检索。一种常见的做法是根据新 token 的语义，使用对应的描述文本来完成初始化，即将值初始化为描述文本中所有 token 的平均值。

2024-09-10 17:21:56 567

原创 VScode 连接远程服务器

vscode 远程连接总结

2024-08-20 18:40:34 647

原创 DeepSpeed 介绍

Nvidia Collective multi-GPU Communication Library的简称，它是一个实现多GPU的collective communication通信（all-gather, reduce, broadcast）库，Nvidia做了很多优化，以在PCIe、Nvlink、InfiniBand上实现较高的通信速度。：一个基于 PyTorch 的分布式训练框架，用来训练基于Transformer的大型语言模型。：多个原语的消息传递接口，这一接口主要被用于多进程间的通信。

2024-03-29 17:04:23 1083

原创目标检测评价标准

将所有检测框按照置信度从高到低的顺序依次加入实际检出框，并分别计算每次加入检测框后对应PR值，对这堆点列平滑后得到PR曲线（Interpolating all points，还有11-point interpolation的计算方法）。：没有被检测到的虚假框的数量，没有使用。：TP / (TP + FP)，所有检测框中正确检测框的比例。：TP / (TP + FN)，所有真值框中被正确检出的比例。：IOU大于阈值的检测框数量。：IOU小于阈值的检测框数量。：没有被检测的真值框的数量。

2024-03-29 11:13:01 751

原创 linux zip 常用功能

【代码】linux zip 常用功能。

2024-03-12 11:10:24 633

原创贝叶斯判别

贝叶斯判别的本质是一类分类问题：基于若干采样样本，如何学习一个分类器对新样本数据进行分类并保证分类错误的概率最小。假设贝叶斯假设某一个新样本属于每个类别为一个随机变量，服从概率分布，那么只要分别计算出的概率，那么概率最大的那个类别就是使分类错误概率最小的分类结果。

2023-12-21 20:14:16 1476 1

原创四元数，欧拉角，旋转矩阵，旋转向量

1、欧拉角是表达旋转的最简单的一种方式，形式上它是一个三维向量，其值分别代表物体绕坐标系三个轴(x,y,z轴）的旋转角度，默认旋转正向为逆坐标轴逆时针方向。2、在旋转过程中，xyz轴方向并不是固定不变的，而是随着前面的旋转而改变。比如如果绕 x 轴旋转 90 度，那么旋转后的 y 轴正向将指向原始的 z 轴方向，而旋转后的 z 轴正向将指向 y 轴负向。

2023-12-08 11:42:20 1469

原创 Diffusion Model: DDIM

虽然 DDPM 中假定了扩散过程服从马尔科夫特性，但是即使不满足依然可以使用 DDPM 的训练过程进行求解。因此 DDIM 就设计了一个不服从马尔科夫特性的扩散过程，从而加速采样。因此，就可以使用如下非马尔科夫分布对反向扩散过程进行采样。DDIM 的分布与 DDPM 的分布之间的差别主要是将。二中给出了逆向扩散过程概率分布，不过具体进行采样时，由于。的估计代入二中的逆向扩散分布中得到具体的递归采样公式。具体设计如下，只要满足如下定义，边缘分布就满足。的具体推导过程中是要求边缘分布服从。

2023-11-25 17:36:52 920

原创 Diffusion Model: DDPM

分布的推导过程：推导过程中，直接递归迭代即可。同时，过程中使用了 —— 两个高斯分布的和也满足高斯分布，其中均值为两个高斯分布均值的和，方差为两个高斯分布方差的和。四、具体生成（采样）过程：根据二中推导的公式，依次计算前一步图像的分布。就是 diffusion model 需要估计的噪声均值，而噪声的方式是由。三、具体训练过程：训练过程比较直接，利用一中的公式即可。

2023-11-25 09:19:31 878

原创鸟哥Linux私房菜 SSH-远程连接服务器

目前常见的网络数据包加密技术通常是通过所谓的“非对称密钥系统”来处理的：主要是通过两把不一样的公钥和私钥（Pubilc and Private Key）来进行加密和解密。公钥（Public Key）：提供给远程主机进行数据加密，公钥需要提供给连接的另一方来对本地端需要接受的数据进行加密。私钥（Private Key）：远程主机使用你的公钥加密的数据，在本地端就能够使用私钥来进行解密。因此私钥是不能够外流的，只能保护在自己的主机上。

2023-11-14 17:50:27 2158

原创 ubuntu cmake 离线安装

如果遇到提示Could not find OpenSSL. Install an OpenSSL development package or ....... 需要安装 apt-get install libssl-dev。下载所需版本的源码。6、最后使用新安装的cmake替换旧版本，其中。1、下载 cmake 源码。为新安装的cmake目录。

2023-08-26 10:53:43 2627

原创 VSCode C++ 调试方法

VSCode 调试 C++ 主要就是 .vscode 中的 launch.json 和 tasks.json 的配置。launch.json 可以通过 vscode 界面 ——》左侧调试功能按钮——》创建 launch.json ——》C++（GDB/LLDB）生成。tasks.json 文件可以通过 vscode 菜单 ——》终端——》配置任务生成。

2023-07-29 17:00:06 3972 1

原创高斯牛顿法 Python 实现

【代码】高斯牛顿法 Python 实现。

2023-05-17 15:57:03 1506

原创几何求解 Python

其中直线以两个点的形式给出，其中 points 为一个 n*2 的向量，表示待求点的坐标；line_points1, line_points2 都为 n*2 的向量，每一列分别为直线两个点的坐标。具体来说，通过计算点与多边形每个顶点之间的夹角，然后判断夹角和是否等于360度。如果夹角和等于360度，则点在多边形内，否则点在多边形外。输入 points 为一个 n*2 的向量，表示待求点的坐标；polygon 为一个 m*2 的向量，每一列为多边形每个顶点的坐标，其中首尾坐标相同构成一个封闭多边形。

2023-04-03 11:06:34 621

空空如也

空空如也