你在康什么-CSDN博客

原创常用向量数据库介绍

本文介绍了向量数据库的基本概念、优势及常见应用场景，对比分析了FAISS、Milvus、ChromaDB等主流向量数据库的特点和适用环境。向量数据库专为高维向量相似度搜索设计，相比传统数据库在处理语义搜索、推荐系统等任务时具有显著优势。文章提供了各数据库的简单代码示例，帮助本科生快速理解不同工具的使用方法，并根据项目需求选择合适的解决方案。

2026-03-10 21:52:12 392 1

原创 LLM 推理结果不一致

进行分类任务，多次推理同一条case，得到的分类结果不一致……

2026-02-04 10:35:29 116

大模型微调训练FAQ摘要核心要点 Loss含义：SFT训练中的loss是交叉熵损失，仅计算assistant回复部分的token预测差异，数值越小越好。 Loss与准确率关系：两者呈正相关但非线性，Loss下降初期准确率提升明显，后期边际效应递减。日志解读：训练loss显著低于验证loss（0.1435 vs 0.2582）表明轻微过拟合 token级准确率差距2.8%（95.4%→92.6%）说明模型泛化能力良好极限值分析： 99%准确率理论上可能但极难实现 eval loss降至0.001基本不

2026-01-29 20:03:33 443

原创大模型微调训练FAQ - 验证集与数据划分

大模型微调训练FAQ摘要本文解答了关于验证集和数据划分的常见问题。验证集不直接影响训练结果，但通过模型选择和超参数调优间接影响性能。虽然技术上可将测试集用作验证集，但存在数据泄露和过拟合风险，建议采用测试集分割或三段式划分方案。train_sft.py中的shuffle操作和seed参数确保了数据均匀分布和实验可重现性。最佳实践包括遵循70-15-15数据划分原则、使用独立验证集、固定随机种子和详细记录实验过程。不同应用场景对测试集使用的风险容忍度不同，需根据实际情况选择合适方案。

2026-01-29 20:02:50 390

原创大模型微调训练FAQ - Batch Size与参数配置

本文探讨了大模型微调训练中Batch Size与参数配置的关键问题。首先分析了Batch Size对显存使用、训练速度和模型效果的影响机制，详细解释了有效批次大小的计算方法。其次比较了不同配置方案（如12×1与6×2）在实际训练中的差异，包括梯度计算精度、数值稳定性和优化器状态更新等方面的区别。最后提供了实用的Batch Size优化策略，包括不同显存情况下的配置建议和监控指标，特别针对LoRA微调场景给出了具体调整方案。文章强调应根据硬件条件平衡性能与稳定性，并提供了测试流程和健康指标监控方法。

2026-01-27 22:11:21 739

原创大模型微调训练FAQ - 训练日志解读

大模型微调训练日志解读指南本文总结了训练日志中关键指标的含义和评估方法。主要指标包括训练loss、梯度范数、学习率、熵值、token准确率等，以及验证集的相应指标。文章详细说明了如何判断训练状态是否正常，识别梯度爆炸/消失、过拟合等异常信号，并给出调整策略建议。同时提供了多层次的监控方案，包括实时指标跟踪、定期验证评估和检查点管理策略。通过系统分析这些指标，可以有效监控训练过程并及时调整优化方向。

2026-01-27 22:10:22 704

原创可话记录格式转换

摘要：为解决背景可话官方动态记录图文分离的痛点，作者开发了「kehua_show」格式转换工具，可将日志转为美观HTML页面，支持图文同步展示、九宫格排版、按月归档等功能，适配多终端。该工具已开源（GitHub地址），未来计划优化界面、简化操作流程并新增动态编写功能。（149字）

2026-01-12 00:08:46 138

原创 Gemini-3D粒子手势控制

HTML实现手势控制3D粒子图案

2025-11-28 21:57:25 473 1

原创满屏祝福代码

这里通过触发每个窗口的space事件来销毁（假设窗口都绑定了space事件）# 实际更严谨的方式是保存所有window实例，这里为简化做此处理。"记得吃水果", "保持好心情", "好好爱自己", "我想你了",# 优化的退出功能：按空格销毁当前窗口，按ESC退出所有窗口并结束程序。"多喝水哦~", "保持微笑呀", "每天都要元气满满","别熬夜", "今天过得开心嘛", "天冷了，多穿衣服""顺顺利利", "早点休息", "愿所有烦恼都消失","梦想成真", "期待下一次见面", "金榜题名",

2025-10-31 09:04:31 540

原创大模型入门参考资料汇总

基础概念，NLP/LLM相关算法，专有名词解释；常见模块介绍。工作内容常见范式，面试常见考点。

2025-09-07 17:06:59 572

原创 flash-attn安装失败解决方案

安装flash-attention2失败解决方案

2025-03-04 17:00:15 2613 1

原创 Cursor 白嫖续费问题处理

当看到以下提示时重置Cursor试用期：`too many free trial accounts used on this machine.`两个解决方法

2024-12-16 11:25:20 3354

原创 Cursor 点击login in 之后无反应

Cursor 点击login in 之后无反应解决方法

2024-12-02 09:30:33 17596 11

原创网关/路由设置

在Ubuntu系统中查看网关设置

2024-11-29 10:59:33 2970

原创 htop命令介绍

htop 是一个交互式的进程查看器，这里介绍了htop常用的使用方法

2024-11-29 10:31:29 537

原创查看Linux内存使用情况

在Linux系统中，有多种方式可以查看内存的使用情况。在这里介绍一些常用的方式

2024-11-29 10:28:14 4518

原创 bibtex 介绍

BibTeX格式介绍

2024-11-25 10:12:48 1390

原创查看笔记本电脑屏幕尺寸

查看笔记本电脑屏幕的两个方法

2024-11-17 21:31:07 2015

原创 python爱心

这个脚本是一个使用 Python 和 Tkinter 库绘制动态爱心图案的程序。

2024-10-20 20:22:34 1163 1

原创 python实现少帅下飞机

基于python实现的少帅下飞机视频

2024-10-20 20:16:10 1330

原创 linux脚本工具

减少重复性工作，简化工作流程，提高工作效率

2024-09-28 17:15:19 304 1

原创 H264-NAL

拉流时存在如下日志,拉流失败进而会导致之后的任务停止

2024-09-22 22:22:09 748

原创 vim入门操作命令

vim 工具本身提供了许多常用快捷键，以下是一些常用的命令

2024-09-22 22:16:30 558

原创 markdown常用语法

如下下是一些常用的语法，足以支撑完成日常记录使用。还有些高级语法，可以查阅相关文档随时使用

2024-09-17 01:08:31 592

原创 DNS入门

有时候，网络明明没有问题，但就是访问不了特定正常的网站。有时候更是只有微信等软甲可以使用，但是无法访问网页出现这些现象时，本地DNS就有可能被污染了。

2024-09-17 01:01:09 1367

原创 Linux代理端口设置

Linux设置局部代理，解决无法访问互联网问题

2024-09-08 13:21:01 1642

原创创建容器失败

本地未安装NVIDIA Container Toolkit 工具。安装NVIDIA Container Toolkit。可以设置代理，通过本地网络进行下载。服务器可能会因为网络原因下载失败。

2024-09-08 12:56:15 940

原创无法通过root用户登录服务器

通过root用户登录Linux服务器

2024-08-29 16:25:32 1335

原创通过ssh访问服务器，显示Offending ECDSA key

解决无法通过ssh登录服务器问题

2024-08-29 16:18:13 672

原创 yolov8轨迹追踪算法无法指定gpu

yolo模型多卡调用

2024-08-03 10:35:50 465

原创机器学习常见的框架及其对应的模型文件格式

机器学习常见的框架及其对应的模型文件格式

2024-06-25 18:00:13 1043 1

原创 SparseOptFlow 和 GMC

稀疏光流（Sparse Optical Flow，简称 SparseOptFlow）是一种用于估计视频序列中两帧之间或两幅图像之间的运动的技术，通过跟踪第一帧中的一组特征点到第二帧。然而，就压缩效率而言，其好处可能是显著的，特别是在具有复杂运动的视频内容中。：在某些情况下，可能会对运动向量进行优化以提高预测的准确性，这可能涉及使用更复杂的技术，如迭代方法或使用额外的帧。：一旦跟踪到点，算法估计描述这些点从第一帧到第二帧运动的运动向量。：最后，补偿后的帧（实际帧和预测帧之间的差异）被编码进视频流中。

2024-04-24 17:11:28 1283

qq_53445310的博客