自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(472)
  • 资源 (6)
  • 收藏
  • 关注

原创 docker私有化部署大模型qwen

以qwen3.5-122b为例子,采用docker部署(我尝试了vllm,没部署上去,应该是vllm 版本和qwen 需要的trasformer的版本不兼容,懒得再试了,干脆用docker部署){"role": "user", "content": "简单介绍一下大模型推理架构"}

2026-04-08 09:47:27 74

原创 openclaw使用不同厂商api

本地部署。

2026-03-26 15:15:15 25

原创 openclaw改配置

建议先备份:cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw_bp.json。查看模型修改是否生效:openclaw models status。修改后重启:openclaw gateway restart。配置在 ~/.openclaw/openclaw.json。

2026-03-25 17:20:40 397

原创 报错CMake Error at CMakeLists.txt:14 (project): ninja‘ ‘--version‘ failed with: no such file or direct

注意如果是uv安装vllm中出现,安装完ninja后,还要清理uv缓存。uv安装vllm过程出现大量报错。

2026-03-19 09:51:23 23

原创 大模型/智能体/rag幻觉问题的根因和解决方案

解决方案:控制H神经元(作用:流畅连贯回答用户问题)

2026-03-18 14:55:32 19

原创 上下文利用率

初期:用简单方法(如显式引用检测、关键词覆盖)建立基线。中期:结合扰动测试和工具调用日志,对关键场景进行抽样分析。长期:如果模型开放注意力,可构建自动化监控管道,定期统计注意力分布,识别长期未使用的上下文类型,优化选取策略。

2026-03-16 16:54:47 24

原创 RAG角度的LangGraph、LlamaIndex

很多 RAG 项目用或实现,其实不是因为,而是因为它们大幅降低了工程复杂度。完全自己实现也是可行的(但是代码会很散)解决数据层问题,它提供了。

2026-03-06 11:08:45 33

原创 python调试/pytest

调试有几种。

2026-03-04 11:08:49 53

原创 报错:cannot import name ‘builder‘ from ‘google.protobuf.internal‘

看了一下全网的解析都不太好,自己上。

2026-03-02 16:17:21 205

原创 命令行中python -m 和 python 运行py的区别

这个时候Python 将脚本所在目录 src 当作工作目录,将其加入加入。(即 workspace)当作工作目录,加入。假设当前在workspace中。

2026-03-02 10:44:04 177

原创 openclaw常用命令

删除后再删除cli:sudo npm rm -g openclaw。检查:openclaw --version 没返回就是成功了。检查是否删除:npm rm -g openclaw。

2026-02-28 16:22:17 1483

原创 rag多查询生成

检索失败时触发,当原始查询检索信息不足时,生成2-3个补充查询来寻找缺失信息。模版二: RAG_Techniques。模版四:pyLLMSearch。模版一:ragflow。

2026-02-25 15:07:52 39

原创 开源rag

反思:对rag答案进行质量评估,若不达到要求则进行重写或者修正。

2026-02-24 20:09:43 47

原创 递归、递归和回溯的区别

预备知识:递归和回溯的区别:回溯是带撤回的。

2026-02-03 16:02:59 59

原创 大模型推理不确定性的根因和解决方法

不确定性是浮点运算导致的。

2026-02-03 11:31:59 71

原创 prompt

https://blog.csdn.net/qq_27590277/article/details/149873902https://zhuanlan.zhihu.com/p/646707552

2026-01-29 10:40:55 129

原创 找工作/面试的时候你需要了解的内容

随意深入了解,例如,如果他/她说员工流失率很低,但部门的平均工作年限只有2年左右,那么你就知道这个部门压力很大。如果答案是工作年限很长,但员工流动很快,尤其是在基层员工/普通员工层面,那么你就知道底层的工作量可能不合理。这里的工作真的很有挑战性,薪酬可能不会很高,但当然,你无法衡量你在这里学到的东西。这里的人们很久才离开,因为公司真的在他们身上投资,如果他们决定跳槽,通常会得到这里收入的 2-3 倍。”如果是空缺职位,“为什么这个职位空缺?一个是我没接受的工作邀请,另一个是现在我的雇主。

2026-01-28 15:04:15 32

原创 推理模型优化

如何优化模型推理

2026-01-28 10:12:02 66

原创 kv cache

KV Cache(键值缓存)是LLM推理中的。,对推理速度和内存使用有决定性影响。

2026-01-28 10:07:33 36

原创 量化方案选型

激活感知,INT4精度更稳定。- 后训练量化,INT4质量好。- CPU优化,灵活比特选择。- 微调+量化,恢复部分精度。

2026-01-28 10:06:08 32

原创 llm推理服务中可变长度输入序列的内存管理

Orca、vLLM的PagedAttention。:动态调整批次中的序列,空闲时立即释放资源。:显著提高GPU利用率(可达5-10倍)将KV缓存分页管理,类似操作系统内存分页。块表(Block Table)跟踪缓存块。允许非连续物理存储,高效处理可变长度。:采用PagedAttention。张量复用:相同大小的张量重复使用。预分配内存池,避免频繁分配释放。逻辑块到物理块的映射。:超过最大长度时截断。

2026-01-28 10:03:44 51

原创 agent开发中的工具(skill, mcp, func)

✅。

2026-01-26 10:37:49 124

原创 图数据库neo4j自建及使用

Bolt 连接:bolt://服务器IP:7687。Web 界面:http://服务器IP:7474。

2026-01-22 15:01:56 131

原创 图数据库选型

更新中。

2026-01-21 11:10:10 46

原创 python多线程和其他语言的区别/GIL全局锁

列表 listx=[]x.append()注意 列表也可以像数组一样x[i], 但前提是列表非空(初始化过),否则会报错

2026-01-19 10:33:03 63

原创 mysql中in和exist区别

SELECT * FROM A WHERE id IN (SELECT id FROM B)1. 执行子查询:SELECT id FROM B → 得到结果集 R2. 将结果集 R 物化(临时表)3. 对主表 A 进行全表扫描4. 对每行检查 id 是否在临时表 R 中SELECT * FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id = A.id)1. 遍历主表 A 的每一行2. 对于每一行,执行子查询: SELECT 1 FROM B WHERE B.id

2026-01-16 16:39:03 138

原创 tcp为什么比udp更可靠

适用于实时性要求高、能容忍少量丢包的场景(如视频流、在线游戏、DNS查询)。:适用于需要可靠传输的场景(如网页浏览、文件传输、邮件)。TCP通过连接管理、确认重传、流量控制实现可靠传输。机制调整发送速率,避免接收方缓冲区溢出。:无流量控制,可能因发送过快导致丢包。:无确认机制,数据包丢失不会重传。:接收方收到数据后发送。发送方未收到ACK会。

2026-01-16 14:29:47 107

原创 agent-SM框架-上下文管理

短期记忆内存中的state,任务期间生效,每个节点实时更新。每轮的对话都是一个新任务,每个新任务开始时,都会创建一个全新的ReactGraphState对象。前几轮任务的state信息不会传递给新的任务。state对象在任务结束后被销毁,不会跨任务传递。状态字段如下:Agent可以通过中期记忆了解前几轮对话的概要信息,将中期记忆转换为历史消息注入到新任务中数据库中的 session_contexts 转换为中期记忆的条件(会话上下文快照)任务成功完成时:当React工作流执行成功(sse_top_l

2026-01-09 14:15:12 52

原创 agent-workflow框架

main.go初始化配置,注册http服务。

2026-01-07 10:45:04 52

原创 agent框架设计

所有智能体地位平等,容易产生责任分散或重复工作。需要达成共识,决策周期长,沟通开销大。增加新智能体会影响所有交互关系,复杂度呈指数增长。用户 → 主Agent → 任务分解 → [子Agent1, 子Agent2, 子Agent3] → 结果整合 → 用户。用户 → [智能体A, 智能体B, 智能体C] → 多轮讨论 → 可能冲突 → 最终响应。主智能体作为协调者,子智能体作为专业执行者,角色清晰。

2026-01-07 10:42:22 53

原创 方差、偏差

方差(Variance)描述的是预测值作为随机变量的离散程度。偏差(Bias)描述的是预测值和真实值之差;

2026-01-06 19:31:41 136

原创 mac电脑网络卡顿解决方法

1、macOS 已知Bug,在airdrop开启的状态下,会影响macbook WiFi的性能,包括:网速慢、WiFi出现断连,或者网卡显示wifi正常接入,实际应用显示”无网络“等情况。MacBook 接口直连显示器,在笔记本与显示器之间进行数据传输时,显示器与本机无线网卡之间产生了干扰,底噪比较高,电脑连接办公网网页访问加载慢,聊天软件消息发送失败、WiFi使用中频繁自动断开。macOS回到桌面点击左上苹果图标,选择“系统设置”。进入通用,选择“隔空投送与接力”,关闭右边全部选项。

2025-12-25 10:23:06 741

原创 kill杀死相关进程rm -rf ~/.cache/JetBrainsrm -rf ~/.config/JetBrainsrm -rf ~/.local/share/JetBrains

【代码】kill杀死相关进程。

2025-12-23 14:33:21 58

原创 【elasticsearch】es数据库同步

【代码】【elasticsearch】es数据库同步。

2025-12-17 14:33:41 71

原创 [elastic search]es清空索引下文档

【代码】[elastic search]es清空索引下文档。

2025-12-17 14:32:48 46

原创 【elasticsearch】es删除索引脚本

但是建议用最简单的方式,直接到kibana的dev tools中,只需一句话。

2025-12-17 14:31:39 68

原创 报错:go: cannot find GOROOT directory: /root/go/pkg/mod/golang.org/toolchain@v0.0.1-go1.24.9.linux-amd

摘要:这段代码配置了Go语言开发环境。首先在.bashrc文件中设置了GOROOT(Go安装路径)和GOPATH(工作目录),并将Go的可执行文件路径添加到系统PATH中。通过source命令使配置立即生效,最后用go version命令验证安装。这些设置是搭建Go开发环境的基本步骤,确保系统能正确识别和运行Go相关命令。

2025-12-12 19:01:26 86

原创 es常用脚本

【代码】es常用脚本。

2025-12-10 16:08:49 42

原创 go实现对象存储

【代码】go实现对象存储。

2025-12-04 20:03:27 82

原创 报错:FileNotFoundError: [Errno 2] No usable temporary directory found in [‘/tmp‘, ‘/var/tmp‘, ‘/usr/tm

2.检查/tmp所在分区的空间使用。1.检查目录是否存在及权限。

2025-11-26 14:26:09 307

coco数据集转yolo格式,自己转的(和yolov1.0提供的不太一样)

自己用代码跑出来的,train包含118289个,val包含5000个,同时有class.txt,train.txt, val.txt 不知道为啥yolov1.0提供的比较少,所以上传一下自己的,如果想要官方转的可以github上搜索

2023-04-28

csdn圣诞节活动:圣诞树代码

发发发

2022-12-03

pascal-5i数据集

小样本学习常用数据集

2022-07-08

手写数字识别代码,自己跑过,能使,不好使可以问我

手写数字识别代码,数据集另发

2022-06-12

ISBI 2015 数据集(上)

训练集共160张左右,带标注 测试集也有160左右,但是不带标注,故不上传 资源设置免费,但是担心csdn收费,这里放出原网址 https://cs.adelaide.edu.au/~zhi/isbi15_challenge/dataset.html

2022-05-25

ISBI 2015 数据集(下)

训练集共160张左右,带标注 测试集也有160左右,但是不带标注,故不上传 资源设置免费,但是担心csdn收费,这里放出原网址 https://cs.adelaide.edu.au/~zhi/isbi15_challenge/dataset.html

2022-05-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除