- 博客(472)
- 资源 (6)
- 收藏
- 关注
原创 docker私有化部署大模型qwen
以qwen3.5-122b为例子,采用docker部署(我尝试了vllm,没部署上去,应该是vllm 版本和qwen 需要的trasformer的版本不兼容,懒得再试了,干脆用docker部署){"role": "user", "content": "简单介绍一下大模型推理架构"}
2026-04-08 09:47:27
74
原创 openclaw改配置
建议先备份:cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw_bp.json。查看模型修改是否生效:openclaw models status。修改后重启:openclaw gateway restart。配置在 ~/.openclaw/openclaw.json。
2026-03-25 17:20:40
397
原创 报错CMake Error at CMakeLists.txt:14 (project): ninja‘ ‘--version‘ failed with: no such file or direct
注意如果是uv安装vllm中出现,安装完ninja后,还要清理uv缓存。uv安装vllm过程出现大量报错。
2026-03-19 09:51:23
23
原创 上下文利用率
初期:用简单方法(如显式引用检测、关键词覆盖)建立基线。中期:结合扰动测试和工具调用日志,对关键场景进行抽样分析。长期:如果模型开放注意力,可构建自动化监控管道,定期统计注意力分布,识别长期未使用的上下文类型,优化选取策略。
2026-03-16 16:54:47
24
原创 RAG角度的LangGraph、LlamaIndex
很多 RAG 项目用或实现,其实不是因为,而是因为它们大幅降低了工程复杂度。完全自己实现也是可行的(但是代码会很散)解决数据层问题,它提供了。
2026-03-06 11:08:45
33
原创 报错:cannot import name ‘builder‘ from ‘google.protobuf.internal‘
看了一下全网的解析都不太好,自己上。
2026-03-02 16:17:21
205
原创 命令行中python -m 和 python 运行py的区别
这个时候Python 将脚本所在目录 src 当作工作目录,将其加入加入。(即 workspace)当作工作目录,加入。假设当前在workspace中。
2026-03-02 10:44:04
177
原创 openclaw常用命令
删除后再删除cli:sudo npm rm -g openclaw。检查:openclaw --version 没返回就是成功了。检查是否删除:npm rm -g openclaw。
2026-02-28 16:22:17
1483
原创 rag多查询生成
检索失败时触发,当原始查询检索信息不足时,生成2-3个补充查询来寻找缺失信息。模版二: RAG_Techniques。模版四:pyLLMSearch。模版一:ragflow。
2026-02-25 15:07:52
39
原创 prompt
https://blog.csdn.net/qq_27590277/article/details/149873902https://zhuanlan.zhihu.com/p/646707552
2026-01-29 10:40:55
129
原创 找工作/面试的时候你需要了解的内容
随意深入了解,例如,如果他/她说员工流失率很低,但部门的平均工作年限只有2年左右,那么你就知道这个部门压力很大。如果答案是工作年限很长,但员工流动很快,尤其是在基层员工/普通员工层面,那么你就知道底层的工作量可能不合理。这里的工作真的很有挑战性,薪酬可能不会很高,但当然,你无法衡量你在这里学到的东西。这里的人们很久才离开,因为公司真的在他们身上投资,如果他们决定跳槽,通常会得到这里收入的 2-3 倍。”如果是空缺职位,“为什么这个职位空缺?一个是我没接受的工作邀请,另一个是现在我的雇主。
2026-01-28 15:04:15
32
原创 llm推理服务中可变长度输入序列的内存管理
Orca、vLLM的PagedAttention。:动态调整批次中的序列,空闲时立即释放资源。:显著提高GPU利用率(可达5-10倍)将KV缓存分页管理,类似操作系统内存分页。块表(Block Table)跟踪缓存块。允许非连续物理存储,高效处理可变长度。:采用PagedAttention。张量复用:相同大小的张量重复使用。预分配内存池,避免频繁分配释放。逻辑块到物理块的映射。:超过最大长度时截断。
2026-01-28 10:03:44
51
原创 python多线程和其他语言的区别/GIL全局锁
列表 listx=[]x.append()注意 列表也可以像数组一样x[i], 但前提是列表非空(初始化过),否则会报错
2026-01-19 10:33:03
63
原创 mysql中in和exist区别
SELECT * FROM A WHERE id IN (SELECT id FROM B)1. 执行子查询:SELECT id FROM B → 得到结果集 R2. 将结果集 R 物化(临时表)3. 对主表 A 进行全表扫描4. 对每行检查 id 是否在临时表 R 中SELECT * FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id = A.id)1. 遍历主表 A 的每一行2. 对于每一行,执行子查询: SELECT 1 FROM B WHERE B.id
2026-01-16 16:39:03
138
原创 tcp为什么比udp更可靠
适用于实时性要求高、能容忍少量丢包的场景(如视频流、在线游戏、DNS查询)。:适用于需要可靠传输的场景(如网页浏览、文件传输、邮件)。TCP通过连接管理、确认重传、流量控制实现可靠传输。机制调整发送速率,避免接收方缓冲区溢出。:无流量控制,可能因发送过快导致丢包。:无确认机制,数据包丢失不会重传。:接收方收到数据后发送。发送方未收到ACK会。
2026-01-16 14:29:47
107
原创 agent-SM框架-上下文管理
短期记忆内存中的state,任务期间生效,每个节点实时更新。每轮的对话都是一个新任务,每个新任务开始时,都会创建一个全新的ReactGraphState对象。前几轮任务的state信息不会传递给新的任务。state对象在任务结束后被销毁,不会跨任务传递。状态字段如下:Agent可以通过中期记忆了解前几轮对话的概要信息,将中期记忆转换为历史消息注入到新任务中数据库中的 session_contexts 转换为中期记忆的条件(会话上下文快照)任务成功完成时:当React工作流执行成功(sse_top_l
2026-01-09 14:15:12
52
原创 agent框架设计
所有智能体地位平等,容易产生责任分散或重复工作。需要达成共识,决策周期长,沟通开销大。增加新智能体会影响所有交互关系,复杂度呈指数增长。用户 → 主Agent → 任务分解 → [子Agent1, 子Agent2, 子Agent3] → 结果整合 → 用户。用户 → [智能体A, 智能体B, 智能体C] → 多轮讨论 → 可能冲突 → 最终响应。主智能体作为协调者,子智能体作为专业执行者,角色清晰。
2026-01-07 10:42:22
53
原创 mac电脑网络卡顿解决方法
1、macOS 已知Bug,在airdrop开启的状态下,会影响macbook WiFi的性能,包括:网速慢、WiFi出现断连,或者网卡显示wifi正常接入,实际应用显示”无网络“等情况。MacBook 接口直连显示器,在笔记本与显示器之间进行数据传输时,显示器与本机无线网卡之间产生了干扰,底噪比较高,电脑连接办公网网页访问加载慢,聊天软件消息发送失败、WiFi使用中频繁自动断开。macOS回到桌面点击左上苹果图标,选择“系统设置”。进入通用,选择“隔空投送与接力”,关闭右边全部选项。
2025-12-25 10:23:06
741
原创 kill杀死相关进程rm -rf ~/.cache/JetBrainsrm -rf ~/.config/JetBrainsrm -rf ~/.local/share/JetBrains
【代码】kill杀死相关进程。
2025-12-23 14:33:21
58
原创 报错:go: cannot find GOROOT directory: /root/go/pkg/mod/golang.org/toolchain@v0.0.1-go1.24.9.linux-amd
摘要:这段代码配置了Go语言开发环境。首先在.bashrc文件中设置了GOROOT(Go安装路径)和GOPATH(工作目录),并将Go的可执行文件路径添加到系统PATH中。通过source命令使配置立即生效,最后用go version命令验证安装。这些设置是搭建Go开发环境的基本步骤,确保系统能正确识别和运行Go相关命令。
2025-12-12 19:01:26
86
原创 报错:FileNotFoundError: [Errno 2] No usable temporary directory found in [‘/tmp‘, ‘/var/tmp‘, ‘/usr/tm
2.检查/tmp所在分区的空间使用。1.检查目录是否存在及权限。
2025-11-26 14:26:09
307
coco数据集转yolo格式,自己转的(和yolov1.0提供的不太一样)
2023-04-28
ISBI 2015 数据集(上)
2022-05-25
ISBI 2015 数据集(下)
2022-05-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅