自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(189)
  • 资源 (1)
  • 收藏
  • 关注

原创 vscode 常用调试

【代码】vscode 常用调试。

2025-05-20 15:51:44 726 1

原创 python 绝对引用和相对引用

在 Python 里面,一个 .py 文件可以称为模块,包含了 __init__.py 文件夹的称为包(python3.3 之后不再要求包文件夹下必须包含 __init__.py)。当一个模块被执行时,Python 会从 sys.path 给出的路径去找在模块中引入的包或其它模块,如果找不到,程序就会报错。

2025-05-07 16:34:15 761

原创 Python 正则表达式 re 包

r"ab?

2025-04-28 17:29:54 498

原创 C++语法概览

常量是固定值,在程序执行期间不会改变编译时常量,因此使用这个关键字可以做编译时优化,运行时性能会比const好。为一个已有的类型取一个新的名字,在复杂项目中可以提高代码可读性一个易变量。每次都需要从内存地址读取这个数据在修饰函数或者变量的时候,告知编译器该函数或变量已在别处定义,可以放心编译构建函数限制只能在本文件调用;不能在其他文件中被调用inline:编译器会将函数在调用点展开,减少了调用开销,提高了代码的执行效率;但是可能会带来代码体积的膨胀。相比较宏定义,inline。

2025-03-26 16:09:27 1400

原创 基于网页信息的SFT训练数据生成

Windows安装路径在 C:\Users\用户名\AppData\Local\ms-playwright\chromium-****\chrome-win。crawl4ai依赖nodejs,playwright及chromium提供模拟浏览网页能力,需要依次安装nodejs,playwright及chromium。爬取调用逻辑:利用爬取到的doc.metadata["links"]["internal"]获取网页中的子链信息,进行迭代式深度爬取。五、基于LLM进行QA生成。

2025-03-24 08:43:31 304

原创 AutoModelForCausalLM 提示 flash_attn 未安装

解决方案:修改/home/*user_name*/miniconda/envs/*env_name*/lib/python3.10/site-packages/transformers/dynamic_module_utils.py check_imports 函数,注释对应校验部分。

2025-03-07 16:14:02 312

原创 python 代码网络受限问题

/anaconda3/envs/***/lib/python*.*/urllib/request.py 添加一下代码。2、huggingface 下载数据 ssl 验证失败。

2024-10-17 21:52:27 400

原创 DPO: Direct Preference Optimization 介绍

DPO 是 RLHF 的屌丝版本,RLHF 需要加载 4 个模型(2个推理,2个训练),DPO 只需要加载 2 个模型(1个推理,一个训练)。

2024-09-14 17:47:28 2313

原创 LLM Tokenizer 介绍

这里我们使用的是不区分大小写的 BERT 模型,因此分词后添加的普通 token [NEW_tok1] 和 [NEW_tok2] 都被处理为了小写,而特殊 token [NEW_tok3] 和 [NEW_tok4] 则维持大写,与 [CLS] 等自带特殊 token 保持一致。PS:不同的语言模型获取 embedding 的方式会有不同,需要根据模型结构进行检索。一种常见的做法是根据新 token 的语义,使用对应的描述文本来完成初始化,即将值初始化为描述文本中所有 token 的平均值。

2024-09-10 17:21:56 434

原创 VScode 连接远程服务器

vscode 远程连接总结

2024-08-20 18:40:34 521

原创 DeepSpeed 介绍

Nvidia Collective multi-GPU Communication Library的简称,它是一个实现多GPU的collective communication通信(all-gather, reduce, broadcast)库,Nvidia做了很多优化,以在PCIe、Nvlink、InfiniBand上实现较高的通信速度。:一个基于 PyTorch 的分布式训练框架,用来训练基于Transformer的大型语言模型。:多个原语的消息传递接口,这一接口主要被用于多进程间的通信。

2024-03-29 17:04:23 929

原创 目标检测评价标准

将所有检测框按照置信度从高到低的顺序依次加入实际检出框,并分别计算每次加入检测框后对应PR值,对这堆点列平滑后得到PR曲线(Interpolating all points,还有11-point interpolation的计算方法)。:没有被检测到的虚假框的数量,没有使用。:TP / (TP + FP),所有检测框中正确检测框的比例。:TP / (TP + FN),所有真值框中被正确检出的比例。:IOU大于阈值的检测框数量。:IOU小于阈值的检测框数量。:没有被检测的真值框的数量。

2024-03-29 11:13:01 632

原创 linux zip 常用功能

【代码】linux zip 常用功能。

2024-03-12 11:10:24 503

原创 贝叶斯判别

贝叶斯判别的本质是一类分类问题:基于若干采样样本,如何学习一个分类器对新样本数据进行分类并保证分类错误的概率最小。假设贝叶斯假设某一个新样本属于每个类别为一个随机变量,服从概率分布,那么只要分别计算出的概率,那么概率最大的那个类别就是使分类错误概率最小的分类结果。

2023-12-21 20:14:16 1315 1

原创 四元数,欧拉角,旋转矩阵,旋转向量

1、欧拉角是表达旋转的最简单的一种方式,形式上它是一个三维向量,其值分别代表物体绕坐标系三个轴(x,y,z轴)的旋转角度,默认旋转正向为逆坐标轴逆时针方向。2、在旋转过程中,xyz轴方向并不是固定不变的,而是随着前面的旋转而改变。比如如果绕 x 轴旋转 90 度,那么旋转后的 y 轴正向将指向原始的 z 轴方向,而旋转后的 z 轴正向将指向 y 轴负向。

2023-12-08 11:42:20 1205

原创 Diffusion Model: DDIM

虽然 DDPM 中假定了扩散过程服从马尔科夫特性,但是即使不满足依然可以使用 DDPM 的训练过程进行求解。因此 DDIM 就设计了一个不服从马尔科夫特性的扩散过程,从而加速采样。因此,就可以使用如下非马尔科夫分布对反向扩散过程进行采样。DDIM 的分布与 DDPM 的分布之间的差别主要是将。二 中给出了逆向扩散过程概率分布,不过具体进行采样时,由于。的估计代入 二 中的逆向扩散分布中得到具体的递归采样公式。具体设计如下,只要满足如下定义,边缘分布就满足。的具体推导过程中是要求边缘分布服从。

2023-11-25 17:36:52 786

原创 Diffusion Model: DDPM

分布的推导过程:推导过程中,直接递归迭代即可。同时,过程中使用了 —— 两个高斯分布的和也满足高斯分布,其中均值为两个高斯分布均值的和,方差为两个高斯分布方差的和。四、具体生成(采样)过程:根据 二 中推导的公式,依次计算前一步图像的分布。就是 diffusion model 需要估计的噪声均值,而噪声的方式是由。三、具体训练过程:训练过程比较直接,利用 一 中的公式即可。

2023-11-25 09:19:31 773

原创 鸟哥Linux私房菜 SSH-远程连接服务器

目前常见的网络数据包加密技术通常是通过所谓的“非对称密钥系统”来处理的:主要是通过两把不一样的公钥和私钥(Pubilc and Private Key)来进行加密和解密。公钥(Public Key):提供给远程主机进行数据加密,公钥需要提供给连接的另一方来对本地端需要接受的数据进行加密。私钥(Private Key):远程主机使用你的公钥加密的数据,在本地端就能够使用私钥来进行解密。因此私钥是不能够外流的,只能保护在自己的主机上。

2023-11-14 17:50:27 2003

原创 ubuntu cmake 离线安装

如果遇到提示Could not find OpenSSL. Install an OpenSSL development package or ....... 需要安装 apt-get install libssl-dev。下载所需版本的源码。6、最后使用新安装的cmake替换旧版本,其中。1、下载 cmake 源码。为新安装的cmake目录。

2023-08-26 10:53:43 2257

原创 VSCode C++ 调试方法

VSCode 调试 C++ 主要就是 .vscode 中的 launch.json 和 tasks.json 的配置。launch.json 可以通过 vscode 界面 ——》左侧调试功能按钮——》创建 launch.json ——》C++(GDB/LLDB)生成。tasks.json 文件可以通过 vscode 菜单 ——》终端——》配置任务 生成。

2023-07-29 17:00:06 3532 1

原创 高斯牛顿法 Python 实现

【代码】高斯牛顿法 Python 实现。

2023-05-17 15:57:03 1371

原创 几何求解 Python

其中直线以两个点的形式给出,其中 points 为一个 n*2 的向量,表示待求点的坐标;line_points1, line_points2 都为 n*2 的向量,每一列分别为直线两个点的坐标。具体来说,通过计算点与多边形每个顶点之间的夹角,然后判断夹角和是否等于360度。如果夹角和等于360度,则点在多边形内,否则点在多边形外。输入 points 为一个 n*2 的向量,表示待求点的坐标;polygon 为一个 m*2 的向量,每一列为多边形每个顶点的坐标,其中首尾坐标相同构成一个封闭多边形。

2023-04-03 11:06:34 531

原创 Linux启动流程

文章参考鸟哥Linux私房菜,针对CentOS,而且版本较老可能与新系统不符。

2023-03-17 12:17:47 399

原创 ROS Tutorials 1.1-1.4

ROS Tutorials手册链接:http://wiki.ros.org/ROS/Tutorials安装:http://wiki.ros.org/kinetic/Installation/Ubuntu环境管理通过printenv | grep ROS判断 ROS 是否正常安装,主要判断 ROS_ROOT 和 ROS_PACKAGE_PATH 是否存在。如果不存在,可以通过执行source /opt/ros/<distro>/setup.bashecho.

2022-11-23 10:02:57 284

原创 ROS Tutorials 1.5-1.7

ROS Tutorials理解 ROS NodesNodesA node really isn't much more than an executable file within a ROS package. ROS nodes use a ROS client library to communicate with other nodes. Nodes can publish or subscribe to a Topic. Nodes can also provide or use a

2022-11-23 10:02:15 214

原创 Colmap 实用教程 —— 整体介绍

Colmap 实用教程

2022-11-23 09:02:52 9625 2

原创 Colmap 实用教程 —— Command-line Interface

Colmap 命令行介绍

2022-11-22 11:03:04 7716 1

原创 基于文本的图像生成

基于文本的图像生成

2022-09-06 11:35:23 1498

原创 视觉自监督学习

视觉自监督学习

2022-09-06 11:13:05 819

原创 Deformable Convolutional Networks

创新点:提出了两个新的模块 deformable convolution 和 deformable RoI pooling,通过学习的方式学习 offset 从而更高效地提取特征点用于卷积操作。

2022-07-04 20:09:51 298

原创 Python装饰器实用教程

最简单的装饰器示例def print_decripter(func): def wrapper(*args, **kwargs): print('wrapper start') tmp = func(*args, **kwargs) print(f'wrapper sum: {tmp}') return tmp return wrapper@print_decripterdef add(a, b): ret

2022-05-23 17:04:16 171

原创 Synergy Windows-Linux多主机共享键鼠

Synergy 使用

2022-04-28 20:28:55 2197

转载 深度图与3D点云互转

深度图与3D点云

2022-01-10 14:54:26 13025 4

原创 Open3d 点云可视化

import open3d as o3dimport numpy as npmesh = o3d.geometry.TriangleMesh.create_coordinate_frame() # 坐标轴T = np.eye(4)# T[0, 0] = -1 # x 轴翻转# T[1, 1] = -1 # y 轴翻转# T[2, 2] = -1 # z 轴翻转# T[0, 3] = 10 # x 轴平移# T[1, 3] = 10 # y 轴平移# T[1, 3] = 10 # z 轴.

2021-12-17 07:39:12 3252

原创 Google 搜索技巧

https://www.youtube.com/watch?v=0gbCi03CNX0** 下面的所有技巧最好使用英文标点符号 **1、完全匹配搜索:"关键词"2、指定文件类型搜索:关键词:文件类型3、站内搜索:关键词 site:网址4、+/- 强制包含或不包含指定关键词:关键词 +/-关键词5、/ 在搜索页快速将光标设置到搜索栏中6、.. 快速定位指定区域:关键词..7、intitle: 只搜索标题含有关键词的网站:intitle: 关键词...

2021-10-15 08:02:20 483

原创 libtorch vision 基础功能介绍

libtorch Tensor 元素引用tensor.index({0, "...", 49, 212}) // 取第 1 维上 (0, *, 49, 212) 上的所有元素Opencv 读取图像常用转换torch::from_blob:从 cv::Mat 转 Tensorcv::cvtColor(frame, frame, CV_BGR2RGB); // step1. BGR->RGBframe.convertTo(frame, CV_32FC3, 1.0f / 255.0f)

2021-08-16 10:48:17 813

原创 ROS 手册

ROS 官方手册:http://wiki.ros.org/cn/ROS/Tutorials本文所有内容都是手册中提炼的关键点1、ROS 工作环境切换一台电脑上可能存在多个 ROS 工作环境,为了更好地使用 ROS 自带的各种命令就需要在不同的工作环境间切换。在工作路径下(带 src)文件夹执行catkin_make 将创建一个 ROS 工作空间,其中新建 devel 文件夹。之后每次需要在这个工作空间下工作,就可以使用source devel/setup.bash切换到当前工作空.

2021-07-15 21:17:44 735

原创 基于 onnx 的 pytorch 模型结构可视化

有时候为了更好的分析现有模型结构,可能需要对模型进行可视化。这里推荐一个在线的可视化图片生成工具 —— netron。通过网页端简单上传 模型就能生成对应模型

2021-06-17 19:43:55 5571

转载 vscode python 远程调试绘图方法

通过 vscode 进行远程调试时无法直接显示远程绘图结果,每次通过保存图片的方式太过繁琐,其实可以通过显式配置 Linux 系统的 DISPLAY 环境变量实现直接显示绘图结果。首先an

2021-06-17 15:34:57 2173

原创 Pytorch tensorboard 使用

from torch.utils import tensorboardimport numpy as npimport keywordimport torchimport shutildef main(): shutil.rmtree('./saved') writer = tensorboard.SummaryWriter('./saved') # add_hparams for i in range(5): writer.add_hpar.

2021-05-29 11:38:52 389

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除