自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 常用向量数据库介绍

本文介绍了向量数据库的基本概念、优势及常见应用场景,对比分析了FAISS、Milvus、ChromaDB等主流向量数据库的特点和适用环境。向量数据库专为高维向量相似度搜索设计,相比传统数据库在处理语义搜索、推荐系统等任务时具有显著优势。文章提供了各数据库的简单代码示例,帮助本科生快速理解不同工具的使用方法,并根据项目需求选择合适的解决方案。

2026-03-10 21:52:12 392 1

原创 LLM 推理结果不一致

进行分类任务,多次推理同一条case,得到的分类结果不一致……

2026-02-04 10:35:29 116

原创 大模型微调训练FAQ - Loss与准确率关系

大模型微调训练FAQ摘要 核心要点 Loss含义:SFT训练中的loss是交叉熵损失,仅计算assistant回复部分的token预测差异,数值越小越好。 Loss与准确率关系:两者呈正相关但非线性,Loss下降初期准确率提升明显,后期边际效应递减。 日志解读: 训练loss显著低于验证loss(0.1435 vs 0.2582)表明轻微过拟合 token级准确率差距2.8%(95.4%→92.6%)说明模型泛化能力良好 极限值分析: 99%准确率理论上可能但极难实现 eval loss降至0.001基本不

2026-01-29 20:03:33 443

原创 大模型微调训练FAQ - 验证集与数据划分

大模型微调训练FAQ摘要 本文解答了关于验证集和数据划分的常见问题。验证集不直接影响训练结果,但通过模型选择和超参数调优间接影响性能。虽然技术上可将测试集用作验证集,但存在数据泄露和过拟合风险,建议采用测试集分割或三段式划分方案。train_sft.py中的shuffle操作和seed参数确保了数据均匀分布和实验可重现性。最佳实践包括遵循70-15-15数据划分原则、使用独立验证集、固定随机种子和详细记录实验过程。不同应用场景对测试集使用的风险容忍度不同,需根据实际情况选择合适方案。

2026-01-29 20:02:50 390

原创 大模型微调训练FAQ - Batch Size与参数配置

本文探讨了大模型微调训练中Batch Size与参数配置的关键问题。首先分析了Batch Size对显存使用、训练速度和模型效果的影响机制,详细解释了有效批次大小的计算方法。其次比较了不同配置方案(如12×1与6×2)在实际训练中的差异,包括梯度计算精度、数值稳定性和优化器状态更新等方面的区别。最后提供了实用的Batch Size优化策略,包括不同显存情况下的配置建议和监控指标,特别针对LoRA微调场景给出了具体调整方案。文章强调应根据硬件条件平衡性能与稳定性,并提供了测试流程和健康指标监控方法。

2026-01-27 22:11:21 739

原创 大模型微调训练FAQ - 训练日志解读

大模型微调训练日志解读指南 本文总结了训练日志中关键指标的含义和评估方法。主要指标包括训练loss、梯度范数、学习率、熵值、token准确率等,以及验证集的相应指标。文章详细说明了如何判断训练状态是否正常,识别梯度爆炸/消失、过拟合等异常信号,并给出调整策略建议。同时提供了多层次的监控方案,包括实时指标跟踪、定期验证评估和检查点管理策略。通过系统分析这些指标,可以有效监控训练过程并及时调整优化方向。

2026-01-27 22:10:22 704

原创 可话记录格式转换

摘要:为解决背景可话官方动态记录图文分离的痛点,作者开发了「kehua_show」格式转换工具,可将日志转为美观HTML页面,支持图文同步展示、九宫格排版、按月归档等功能,适配多终端。该工具已开源(GitHub地址),未来计划优化界面、简化操作流程并新增动态编写功能。(149字)

2026-01-12 00:08:46 138

原创 Gemini-3D粒子手势控制

HTML实现手势控制3D粒子图案

2025-11-28 21:57:25 473 1

原创 满屏祝福代码

这里通过触发每个窗口的space事件来销毁(假设窗口都绑定了space事件)# 实际更严谨的方式是保存所有window实例,这里为简化做此处理。"记得吃水果", "保持好心情", "好好爱自己", "我想你了",# 优化的退出功能:按空格销毁当前窗口,按ESC退出所有窗口并结束程序。"多喝水哦~", "保持微笑呀", "每天都要元气满满","别熬夜", "今天过得开心嘛", "天冷了,多穿衣服""顺顺利利", "早点休息", "愿所有烦恼都消失","梦想成真", "期待下一次见面", "金榜题名",

2025-10-31 09:04:31 540

原创 大模型入门参考资料汇总

基础概念,NLP/LLM相关算法,专有名词解释;常见模块介绍。工作内容常见范式,面试常见考点。

2025-09-07 17:06:59 572

原创 flash-attn安装失败解决方案

安装flash-attention2失败解决方案

2025-03-04 17:00:15 2613 1

原创 Cursor 白嫖续费问题处理

当看到以下提示时重置Cursor试用期:`too many free trial accounts used on this machine.`两个解决方法

2024-12-16 11:25:20 3354

原创 Cursor 点击login in 之后无反应

Cursor 点击login in 之后无反应解决方法

2024-12-02 09:30:33 17596 11

原创 网关/路由设置

在Ubuntu系统中查看网关设置

2024-11-29 10:59:33 2970

原创 htop命令介绍

htop 是一个交互式的进程查看器,这里介绍了htop常用的使用方法

2024-11-29 10:31:29 537

原创 查看Linux内存使用情况

在Linux系统中,有多种方式可以查看内存的使用情况。在这里介绍一些常用的方式

2024-11-29 10:28:14 4518

原创 bibtex 介绍

BibTeX格式介绍

2024-11-25 10:12:48 1390

原创 查看笔记本电脑屏幕尺寸

查看笔记本电脑屏幕的两个方法

2024-11-17 21:31:07 2015

原创 python爱心

这个脚本是一个使用 Python 和 Tkinter 库绘制动态爱心图案的程序。

2024-10-20 20:22:34 1163 1

原创 python实现少帅下飞机

基于python实现的少帅下飞机视频

2024-10-20 20:16:10 1330

原创 linux脚本工具

减少重复性工作,简化工作流程,提高工作效率

2024-09-28 17:15:19 304 1

原创 H264-NAL

拉流时存在如下日志,拉流失败进而会 导致之后的任务停止

2024-09-22 22:22:09 748

原创 vim入门操作命令

vim 工具本身提供了许多常用快捷键,以下是一些常用的命令

2024-09-22 22:16:30 558

原创 markdown常用语法

如下下是一些常用的语法,足以支撑完成日常记录使用。还有些高级语法,可以查阅相关文档随时使用

2024-09-17 01:08:31 592

原创 DNS入门

有时候,网络明明没有问题,但就是访问不了特定正常的网站。有时候更是只有微信等软甲可以使用,但是无法访问网页出现这些现象时,本地DNS就有可能被污染了。

2024-09-17 01:01:09 1367

原创 Linux代理端口设置

Linux设置局部代理,解决无法访问互联网问题

2024-09-08 13:21:01 1642

原创 创建容器失败

本地未安装NVIDIA Container Toolkit 工具。安装NVIDIA Container Toolkit。可以设置代理,通过本地网络进行下载。服务器可能会因为网络原因下载失败。

2024-09-08 12:56:15 940

原创 无法通过root用户登录服务器

通过root用户登录Linux服务器

2024-08-29 16:25:32 1335

原创 通过ssh访问服务器,显示Offending ECDSA key

解决无法通过ssh登录服务器问题

2024-08-29 16:18:13 672

原创 yolov8轨迹追踪算法无法指定gpu

yolo模型多卡调用

2024-08-03 10:35:50 465

原创 机器学习常见的框架及其对应的模型文件格式

机器学习常见的框架及其对应的模型文件格式

2024-06-25 18:00:13 1043 1

原创 SparseOptFlow 和 GMC

稀疏光流(Sparse Optical Flow,简称 SparseOptFlow)是一种用于估计视频序列中两帧之间或两幅图像之间的运动的技术,通过跟踪第一帧中的一组特征点到第二帧。然而,就压缩效率而言,其好处可能是显著的,特别是在具有复杂运动的视频内容中。:在某些情况下,可能会对运动向量进行优化以提高预测的准确性,这可能涉及使用更复杂的技术,如迭代方法或使用额外的帧。:一旦跟踪到点,算法估计描述这些点从第一帧到第二帧运动的运动向量。:最后,补偿后的帧(实际帧和预测帧之间的差异)被编码进视频流中。

2024-04-24 17:11:28 1283

原创 Linux中的中文名

只需要直接复制乱码那一部分进行操作即可,虽然最终命令行显示的内容都是同样的文字,但是Linux读取的信息不同。当你对这个文件(文件夹)进行操作时,系统无法找到你所描述的文件,因为你输入的名称和系统中的名称不一致。所以为什么不建议再Linux系统中或者代码路径下使用中文名呢。直接输入文件名无操作,那么如何操作这个文件呢?图 Linux系统眼中的文件名。这个还请看到的大佬解惑一二。可能和编码格式有关?那么这样就导致一个结果。

2024-04-20 20:58:18 215

原创 docker 减小镜像大小

镜像瘦身

2024-03-21 17:51:02 423 1

原创 网关配置相关

访问10.243.0.0系列的ip时,会通过10.243.1.126进行访问。连接局域网的网络后依然无法访问其他ip。

2024-02-28 14:35:44 510

原创 人脸识别实战

1.直接下载压缩包,之后在本地进行解压,以达到下载源码的作用。实战共有9步,其中每一步走的都远比想象的困难。止步于此,待通过其他攻略解决之后产生的问题。OpenCV没有可以调用的摄像头设备。在运行如下命令配置环境时,总会报错。Linux系统没有摄像头……然后进行人脸信息的录入。

2024-02-27 22:53:42 766

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除