自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(233)
  • 收藏
  • 关注

原创 Ubuntu22.04 离线安装 CUDA12.3 依赖报错解决方案

绝对不要用,CUDA12.3 必须用离线环境最稳的方案是runfile 安装,完全规避 apt 依赖问题安装后必须配置环境变量,才能用nvcc -V验证。

2026-04-17 17:28:44 86

原创 docker运行容器

【-it交互式启动容器】【-d后台式启动容器】

2026-04-17 11:27:19 7

原创 AI错误答案记录4

2026-04-16 14:32:50 4

原创 AI错误答案记录3

2026-04-16 13:42:12 7

原创 vllm/vllm-openai镜像只进入容器,不启动模型

docker run -it --gpus all --network=host --ipc=host --rm --name qwen3.5-test \ -v /home/vllm-models/Qwen3___5-35B-A3B:/home/vllm-models/Qwen3___5-35B-A3B \ --entrypoint /bin/bash \ vllm/vllm-openai

2026-04-16 11:22:29 199

原创 AI错误答案记录2

2026-04-16 11:21:52 5

原创 scp、rsync远程文件同步

scp -r langchain_dev.zip root@1.2.2.5:/home//usr/bin/rsync -avP --partial --progress root@1.1.1.1:/home/langchain_dev.zip .

2026-04-15 17:38:35 14

原创 克隆仓库使用http而不是git的场景

git需要服务器密码(可能需要仓库配置key),使用http则只需要账号信息。

2026-04-09 14:56:06 12

原创 docker logs 如何一直监听日志输出

f(follow)--tail=行数-tCtrl + C。

2026-04-09 13:26:30 30

原创 掌握解析JSON输出的技巧:使用LLM生成结构化数据

借助Pydantic,我们可以方便地定义所需的数据结构。例如,我们将定义一个简单的笑话结构:本篇文章介绍了如何通过LLM生成并解析JSON输出。在实际应用中,合理地使用这些技术能显著提高NLP任务的精确度。接下来,请查看获得结构化输出的更广泛指南来探索其他技术方案。

2026-04-01 10:33:34 216

原创 Qwen3-VL-30B-A3B-Thinking-FP8思考部分识别问题

措施如下:将<think>\\n删除后,重启模型。

2026-03-27 10:33:25 29

原创 vllm单机双卡部署Qwen3 30B FP8模型踩坑记录

想着KV cache也不小,能把这个减小了也行,尝试了一下,观察了vllm启动的日志,突然发现不一样了,如果kv-cache-dtype设置为fp8的话,vllm自动退回V0引擎启动模型(默认在Ampere、Hopper等较新的架构上使用V1引擎),然后就启动成功了!单位搞建设,配了台双4090的工作站,想着终于能部署个大点的模型了,根据显存大小,打算部署Qwen3的30B模型,结果反复遇到问题……Qwen3-30B-A3B-Thinking-2507-FP8的tokenizer_config.json。

2026-03-27 10:27:30 372

原创 windows中粘贴拷贝文件不会显示进度条,尤其是大文件

一些增强类工具(如 7-Zip、TortoiseGit、Dropbox)会注入 Shell 扩展,劫持复制流程并抑制默认进度对话框的显示。这个问题虽然不影响文件复制的实际功能,但会降低操作的可感知性,让你难以判断是否卡顿或正在进行。若系统性能设置为“调整为最佳性能”,Windows 会自动关闭动画和过渡效果,包括文件复制时的进度窗口。某些系统优化工具或精简版系统可能直接关闭了 UI 过渡动画,导致进度条不可见。损坏或注册表项禁用了进度条,也会导致此问题。

2026-03-25 16:12:32 83

原创 模型powershell下载显示异常

我给你把原因讲得明明白白,你安心继续等就行👇。只要这三个任意一个在动 →。

2026-03-25 11:11:32 32

原创 AI错误答案记录

2026-03-25 09:44:10 13

原创 python离线安装minio依赖异常

pip安装minio 7.2.20时,其依赖的argon2_cffi_bindings-25.1.0安装异常。将argon2_cffi_bindings版本降为21.2.0后解决。

2026-03-19 19:02:17 26

原创 centos7离线安装gcc需要的依赖及下载命令

在 CentOS 7 离线环境中安装 GCC,需提前在‌‌上下载所需 RPM 包及其依赖,再传输到目标机安装。以下是基于权威公开资料整理的‌。

2026-03-16 10:30:24 386

原创 智能问答文件存储minIO

核心选择:优先使用「单存储桶 + 会话 ID 路径前缀」的方案,而非为每个会话创建存储桶,兼顾管理效率和隔离性;关键设计:统一存储桶名称,按session_xxx/文件名规范设计文件路径,便于检索和权限控制;运维优化:通过生命周期规则自动清理过期文件,结合哈希去重减少存储成本,保障系统长期稳定运行。这种方案既符合对象存储的设计理念,又能适配智能问答场景下会话文件的管理需求,是行业内的通用最佳实践。

2026-03-11 11:21:30 358

原创 Ubuntu中Docker重启后因缺失iptables命令启动失败的原因及解决办法

启动态:Docker 重启时会重新初始化网络栈,必须执行iptables -L/iptables -N等命令来创建 / 检查网络规则,此时系统找不到 iptables 命令,就会直接启动失败。Docker 运行时依赖内核中已加载的 iptables 规则,而非用户态的 iptables 命令,因此即使命令缺失,只要规则还在,服务就能继续跑;简单说:规则 “存在于内核里”,而非依赖用户态的 iptables 命令持续存在。# 安装iptables的兼容层(确保Docker能调用到iptables)

2026-03-03 19:41:04 353

原创 OpenResty

是一个基于与深度集成的,由章亦春(agentzh)于 2009 年创建。它将 Nginx 的事件驱动、高并发能力与 Lua 脚本的动态可编程性结合,让你能在 Nginx 内部直接编写业务逻辑,构建超高并发的动态服务OpenResty®。

2026-03-03 10:59:37 963

原创 假如客户端a请求服务端b的8080端口,在流量解析时,我理解至少可以解析出client_ip,server_ip,server_port,会解析出来client_port吗

会的,,而且这是 TCP/UDP 通信里的字段。

2026-03-03 10:44:17 48

原创 Qwen3-32B报错Invalid json output:{“type“: “1“}For troubleshooting, visit

vllm版本0.9.1。

2026-02-07 09:20:02 348

原创 Qwen3-32B大模型vLLM启动建议

多卡部署:若需使用多张卡部署(如 2 张、4 张 A100 80G),可按实际卡数调整该参数(如 2 张卡设为 2、4 张卡设为 4),多张卡的显存会联合承载模型权重,单卡显存要求会按比例降低(如 2 卡 float16 部署,单卡显存需 40GB+);,为 Qwen3-32B 模型的推理逻辑专属解析器,与工具调用配置配合使用,可优化模型推理和工具调用的衔接逻辑,建议保留该参数。,用于设置模型权重拆分到的 GPU 卡数,实现多卡负载均衡,提升大模型的加载和推理效率。,充分利用多卡算力,达到最佳的推理性能。

2026-02-06 17:40:06 549

原创 qwen3-32b的maxToken设置建议

适用场景:写千字级文章、整段文档总结、多步骤分析报告、复杂代码工程maxToken 设置原因:Qwen3-32B 的 8k 上下文,预留 4k 左右给输入 prompt(足够承载千级汉字的长文本),4k 生成令牌能覆盖大部分长文本需求;不建议超过 4096,否则剩余输入空间过小,易丢失上下文。Qwen3-32B 的maxToken设置核心围绕8k 原生上下文基础硬边界:输入 + 生成令牌数 ≤ 8192,非 32k 版本不超此值;

2026-02-06 14:35:07 480

原创 ubuntu系使用root用户登录显示密码错误

前台启动,阻塞运行,保持容器不退出# 或者重启sshd服务(让配置生效)先启动 sshd 再改密码,导致密码修改命令未执行,这是登录密码错误的根本原因;必要配置:ubuntu22.04 需修改开启,否则即使密码正确也无法 root 登录;正确顺序:更新源→装 ssh→改 sshd 配置→改 root 密码→最后启动 sshd;持久化:通过提交镜像,避免容器重启后配置丢失。

2026-02-02 13:33:29 487

原创 基于centos7镜像制作docker镜像

通过编写Dockerfile,你可以精确控制镜像的每一层,确保镜像的安全性和可移植性。虽然这种方法理论上可行,但通常不推荐,因为它涉及到导出和导入整个文件系统,这比使用Dockerfile更加复杂且低效。这种方法涉及到创建一个Dockerfile,它是一个文本文件,包含了一系列命令,用于构建一个Docker镜像。这将会基于centos:7镜像创建一个新的镜像,命名为my-centos7-image。方法2:使用现有的CentOS 7镜像并导出为新镜像(不推荐)步骤3:构建Docker镜像。

2026-02-02 10:52:36 301

原创 qwen3-32B的maxTokens设置

completion建议 ≤ 8192,总 Token 控制在 32768 内128K 扩展场景:需 YaRN 配置 + 充足显存,completion可适度放宽,但仍需预留 messages 空间优先保证输入完整性,再调整生成长度,避免因 completion 过大导致上下文截断。

2026-02-02 10:31:50 608

原创 you requested 35835 tokens (5835 in the messages, 30000 in the completion)

messages tokens:你的输入、prompt、聊天历史 → 入站 tokencompletion tokens:模型生成的回答 → 出站 token总和 = 本次调用总 token(计费、限流都看这个)

2026-02-02 10:29:23 342

原创 “auto” tool choice requires --enable-auto-tool-choice and --tool-call-parser to be set

在模型vllm启动时,添加两个参数:# --enable-auto-tool-choice --tool-call-parser hermes。参考:https://blog.csdn.net/qq_42869979/article/details/146226982。

2026-01-23 09:44:19 2778 1

原创 anaconda环境中如何生成requirements

如果你的Anaconda环境是基于Python虚拟环境的(比如使用`conda create -n myenv python=3.8`创建的环境),你可以将其当作一个标准的Python虚拟环境来处理,从而使用`pip freeze`来生成`requirements.txt`。2. 转换`.yml`到`requirements.txt`:虽然Conda原生支持`.yml`文件,但如果你想生成一个更通用的`requirements.txt`文件,可以使用`conda-pack`或者手动转换。

2026-01-22 14:29:14 500

原创 InfiniFlow

Infinity:一款 AI 原生数据库,专为 LLM 应用优化,支持密集向量、稀疏向量、张量和全文等多种数据类型的混合搜索,具备低延迟(0.1 毫秒级)和高吞吐量(15K+ QPS)特性,适用于搜索、推荐、问答等场景。- RAGFlow:一个开源的检索增强生成引擎,融合了 RAG 与智能体(Agent)能力,提供自动化的工作流、可配置的 LLM 和嵌入模型,以及多召回融合重排序功能,支持企业级部署。- 行业观点:公司创始人兼 CEO 张颖峰曾公开表示,中国在开源模型和应用领域已处于世界领先地位。

2026-01-22 11:34:27 217

原创 kylinV10 arm docker镜像下载

docker inspect --format '{{.Architecture}}/{{.Os}}' [镜像编号/镜像标签]查看镜像CPU架构(arm64/amd64)

2026-01-21 14:41:57 160

原创 hub.docker.com和docker.com

是 Docker 官方的镜像仓库(Docker Hub)专属域名,也是 Docker 镜像相关的核心官网。补充:两者同属 Docker 官方域名,数据互通,登录 Docker Hub 的账号也可在。是 Docker 官方主站,而。

2026-01-21 14:14:45 501

原创 docker导入导出命令

docker save macrosan/kylin:v10-sp3-2403 | gzip> kylin_v10-sp3-2403.tar.gzdocker load < kylin_v10-sp3-2403.tar.gz

2026-01-21 13:56:01 110

原创 2026年docker镜像下载

参考原文:https://www.cnblogs.com/xietingfeng321/p/18451170。

2026-01-21 13:51:40 288

原创 centos配置域名解析

在 CentOS 系统上配置域名解析通常涉及到修改 DNS 服务器配置,这可以通过几种方式实现,包括使用本地 hosts 文件、修改 `/etc/resolv.conf` 文件或设置一个本地 DNS 缓存服务器(如 BIND 或 Unbound)。对于使用 DHCP 的系统,通常不需要手动编辑 `/etc/resolv.conf`,因为 DHCP 服务器会自动更新此文件。2. 配置 BIND 主文件(例如 `/var/named/named.conf`),添加或修改区域文件。3. 保存并关闭文件。

2026-01-21 13:10:45 406

原创 autogen能做到但langgraph做不到的能力有哪些

AutoGen 的核心优势在于对话驱动的灵活性、开箱即用的角色生态、原生代码执行能力,这些能力让它在非结构化协作与快速迭代场景中更高效;而 LangGraph 则在流程可控性与状态管理上更强。选择框架时,可根据任务是否需要动态对话、代码执行频率、人在回路需求来决定。需要我基于以上差异,提供一个AutoGen 快速实现代码生成 - 执行 - 调试闭环的最小示例(含 Docker 沙箱配置)吗?

2026-01-07 15:12:17 432

原创 postgres数据库备份和恢复命令

‌:物理备份需确保目标服务器与源服务器版本一致,且配置文件(如。)已正确设置复制权限。

2025-12-18 15:34:56 294

原创 启动容器报错ls: cannot access ‘/docker-entrypoint-initdb.d/‘: Operation not permitted

错误原因分析。

2025-12-18 15:10:20 451

原创 调用langgraph的aupdate_state()方法时异常

之前可以修改的消息现在也修改失败了,但还是有消息可以修改成功的情况。暂未找到任何解决办法。

2025-12-10 15:26:07 104

kylinv10 docker镜像下载(kylinv10-kylin-b09)

kylinv10 docker镜像下载(kylinv10-kylin-b09)

2026-04-17

kylinv10 arm docker镜像下载(kylin-v10-sp3-2403)

kylinv10 arm docker镜像下载(kylin-v10-sp3-2403)

2026-04-17

图数据库neo4j的arm版docker镜像

#!/bin/bash echo "启动 Neo4j 容器..." # 直接启动neo4j容器,将自动创建宿主机挂载目录 docker run -it -d -p 7474:7474 -p 7687:7687 \ -v /home/neo4j/data:/data \ -v /home/neo4j/logs:/logs \ -v /home/neo4j/conf:/var/lib/neo4j/conf \ -v /home/neo4j/import:/var/lib/neo4j/import \ -v /home/neo4j/plugins:/var/lib/neo4j/plugins \ -e NEO4J_AUTH=neo4j/password \ --name neo4j neo4j:4.4.0 # 检查是否启动成功 if [ $? -eq 0 ]; then echo "容器启动成功!" echo "HTTP 访问地址:http://localhost:7474" else echo "容器启动失败" exit 1 fi docker ps -a

2025-03-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除