- 博客(112)
- 收藏
- 关注
原创 模型如何自主判断调用工具
模型通过分析用户查询的意图、对比自身能力与可用工具的功能,并遵循系统指令中定义的决策规则,来判断是否需要调用工具。现代大模型通过。
2026-06-15 17:04:44
277
原创 自研AI代理工具核心架构
开发类似 OpenClaw 的工具,核心是构建一个能够调用大模型 API 并执行具体任务(如文件操作、网络搜索、代码执行)的 AI 代理(Agent)系统。以下是关键步骤与技术方案。###一、核心架构设计。
2026-06-15 16:52:07
198
原创 词云分析中的特定简要分析
强调主题、概念、情感词、名词、动词等有实际语义的内容,而不是数值或时间这类结构化数据。(比如从大量含日期的文本中看哪个月份/年份被提及最多),否则一般都会主动剔除日期。会分散对真正关键词的注意力,让词云变得杂乱。去除停用词(“的”“了”“是”等)每个频率很低(大多为 1 次)只保留名词、动词、形容词等实词。去除数字、标点、日期等。不具备“主题代表性”
2026-05-04 10:52:09
244
原创 Python 和Streamlit 在统计筛选方面的差别
特性纯 Python 脚本Streamlit 应用交互性几乎没有,需手动修改变量实时交互,按钮/滑动条/筛选器展示媒介终端(黑窗)或 静态图片现代化的 Web 浏览器页面实时性运行结束即停止持续运行,监听用户动作学习成本基础语法只需多学几个st.开头的函数。
2026-04-08 06:39:00
240
原创 ubuntu建虚拟环境制作docker容器
方面虚拟环境开发Docker 部署代码修改实时生效,无需重启需要重新构建镜像调试方便,有完整日志需要查看容器日志依赖管理pip install 直接安装通过 requirements.txt环境隔离Python 级别系统级别生产部署不适合✅ 适合。
2026-04-01 17:09:24
104
原创 RFC3339格式(带 T 的格式)简要介绍
T = Time 的分隔符,是国际标准服务端发的是空格格式,不是标准 RFC3339Go 默认解析不了空格,必须自定义 layout用就能完美解析。
2026-03-20 11:33:09
277
原创 DNS 验证验证SSL证书
--dns-providers - 指定DNS服务提供商(如cloudflare、route53等)- sudo certbot certonly - 基础命令,获取证书但不自动安装。- HTTP验证 :需要在服务器上提供临时文件,适合有web服务器的场景。- DNS验证 :通过DNS记录验证,适合无法直接访问服务器的场景。DNS验证是一种灵活的验证方式,特别适合复杂网络环境下的证书获取。- --dns-01 - 指定使用DNS记录验证方式。2. 您需要在域名的DNS记录中添加一条TXT记录。
2026-03-16 10:29:15
62
原创 openclaw的技术原理
OpenClaw = 一个本地跑的“AI 总控网关”,把所有聊天应用(以及你的电脑、手机能力)都接进来,统一交给一个或多个 AI Agent 处理,然后再通过原渠道把结果发回去。你可以只记住这个最简单的例子:“我在 Telegram 发一句话 → 网关转给 AI 想 → AI 想好后再让网关帮我回 Telegram。整个 OpenClaw 的技术原理就是围绕这个路由 + 代理 + 工具调用闭环扩展出来的。
2026-03-16 09:01:34
677
原创 清理docker残留镜像images
核心原因:镜像被已停止的容器引用,Docker 阻止了普通删除操作。推荐操作:先执行删除关联容器,再执行删除镜像。注意事项:强制删除(-f)仅作为备选,优先选择 “删容器→删镜像” 的顺序,避免破坏有用的容器。
2026-02-08 22:25:15
811
原创 模态框和传统html新页面的优劣分析
模态框的核心优势是交互流畅、上下文保留,适合轻量、临时、无需分享的短操作;缺点是 URL 无同步、可访问性需额外处理,不适合复杂场景。传统新页面的核心优势是结构清晰、支持 URL / 导航,适合核心功能、复杂内容、需分享的场景;缺点是上下文丢失、性能损耗,不适合轻量临时操作。实际开发中可结合使用(如列表页用模态框预览简单信息,点击 “查看完整详情” 跳转新页面),兼顾体验与实用性。
2026-02-07 22:21:53
635
原创 Rerank模型简介二——耗时问题
Rerank 模型不替代向量相似度,而是对向量检索后的候选结果做精细化重排,二者是 “粗筛 + 精排” 的协作关系;Rerank 并非 “非常耗时”:仅处理少量候选数据,新增耗时可控(百毫秒级),且可通过选轻量模型、控制候选数进一步优化;核心价值:以少量耗时成本,大幅提升检索结果的语义匹配精度,是 RAG 等场景中 “性价比极高” 的优化手段。
2026-01-31 14:15:40
590
原创 Rerank模型简介
Rerank 模型(重排序模型)是检索 + 排序流程中的后序优化模型,核心作用是对初步检索出的候选结果做精细化打分、重新排序,让与查询意图最匹配的结果排在最前,解决初步检索(如关键词检索、向量检索)精度不足、排序粗糙的问题。简单说:初步检索负责「从海量数据里快速捞取相关候选(比如 100 个)」,Rerank 模型负责「对这 100 个候选做精准筛选排序,挑出 Top10 最贴合的」,是 **“粗筛 + 精排”** 检索架构的核心组件。
2026-01-31 13:53:55
778
原创 虚拟机VM调用物理机GPU相关问题
虚拟机中部署 AI 大模型问答系统,核心取决于和,主流的实现方式是和,前者性能损耗极低,是大模型部署的首选,后者适合多虚拟机轻量共享 GPU 资源。,但通过专门的虚拟化配置,能让虚拟机直接 / 间接使用物理机的 GPU 算力,满足大模型的推理 / 训练需求。
2026-01-31 09:52:41
1264
原创 嵌入模型和大语言模型的关系
直接回答用户问题(如「解释一下 RAG 的原理」);总结长文本(如把你的知识库内容总结成核心要点);多轮对话(如「基于这个知识点,再举个例子」)。核心区别:嵌入模型(MiniLM/bert/nomic)= 文本→向量(检索),无推理;LLM(qwen:1.5b/deepseek-r1)= 文本→文本(推理 / 生成);协作逻辑:RAG 场景中,嵌入模型负责「找相关文本」,LLM 负责「用这些文本推理回答」;
2026-01-26 08:50:10
948
原创 文本嵌入模型的比较(三)
核心原因:嵌入函数决定向量的维度、语义空间、数值分布,更新函数后旧向量在新空间中无意义,检索失效;实操关键:无需重建 chromadb 客户端,只需新建集合 + 重新导入文本(用新函数生成新向量);本质逻辑:向量数据库的「检索准确性」依赖「嵌入函数和向量的一一对应」,这是所有向量数据库(chromadb/pinecone/milvus)的通用规则。
2026-01-26 01:11:33
410
原创 文本嵌入模型的比较(二)
核心定位是 chromadb 推出的「速度 + 精度平衡」的新一代默认嵌入模型,支持中文但依赖 onnxruntime;对比结论:精度>ONNXMiniLM_L6_V2,速度>bert-base-chinese,中文适配性≈bert-base-chinese;建议:继续使用更稳妥(无 onnxruntime 依赖,中文生态成熟),除非有长文本 / 多语言 / 速度优化的明确需求。简单说,是「折中方案」,但对纯中文知识库项目,仍是更适配、更稳定的选择。
2026-01-26 01:03:18
741
原创 文本嵌入模型的比较(一)
核心差异:ONNXMiniLM_L6_V2 胜在「快、轻、原生」,bert-base-chinese 胜在「中文准、信息全、适配广」;选型结论:中文知识库项目优先用 bert-base-chinese(代码改造量小,精度收益大);落地建议:按之前给的代码替换 chromadb 嵌入函数,无需装 onnxruntime,直接复用已安装的 sentence-transformers 即可。简单说,牺牲一点速度换中文检索的精准度,对项目是更优选择;
2026-01-26 00:56:21
676
原创 Windows 系统中通过 Conda 「克隆」环境
如果想把新环境复制到非默认路径(比如 D 盘,避免 C 盘占用),用--prefix# 格式:conda create --prefix 新环境路径 --clone 原环境名 -y# 示例:把 "zhishiku" 克隆到 D 盘的 conda_envs 目录下,新环境名(路径)为 D:\conda_envs\zhishiku_copy。conda create -n 新环境名 --clone 原环境名 -y(默认路径克隆);
2026-01-25 15:44:34
533
原创 ubuntu中虚拟环境的简单创建和管理
python3 -m venv 环境名;source 环境名/bin/activate;deactivate。管理就记住 2 个操作:激活后用装包,删环境直接删文件夹。
2026-01-22 12:30:07
431
原创 虚拟环境隔离安装senten-transformer
应用代码(main.py 等)无需任何修改,虚拟环境不影响代码逻辑;关键操作:运行代码前必须激活虚拟环境,或在启动命令中指定虚拟环境内的 Python 解释器路径;特殊场景:若用后台服务(Supervisor/Gunicorn)运行,只需修改启动命令的路径,无需改代码。按这个方式操作,就能让代码正常使用虚拟环境中的依赖,且完全保留原有业务逻辑。
2026-01-22 12:15:46
454
原创 虚拟机ubuntu中磁盘满了 + 镜像损坏,如何解决
如果强迫症想装原生 Docker,执行下面的命令一键安装(Ubuntu/Debian 通用),安装后 Podman 的软链接会被覆盖,执行完后注销重新登录,即可免 sudo 执行 docker 命令。,连执行删除命令的临时空间都没有,所以删镜像也报错,优先级:先。可选:安装原生 Docker(如果想彻底替换 Podman)目标:磁盘空间释放、坏镜像删掉、容器正常启动。清空间 → 再删垃圾 → 最后操作容器镜像。Podman 与 Docker 的无缝切换。验证是否全部恢复正常。
2026-01-19 21:13:07
368
原创 读懂gunicorn基本配置
这条命令的完整解读是:调用这个 Python 虚拟环境中的 Gunicorn 服务器,启动时加载目录下的配置文件,然后从当前工作目录的app.py模块中读取app这个 Web 应用实例,最终以 WSGI 协议运行该 Python Web 应用。
2026-01-19 14:47:53
372
原创 python 在windows如何开启webserver
快速启动静态服务器:用python -m http.server [端口](Python 3),适合临时共享文件 / 测试静态页面。动态内容 / 开发:推荐用 Flask 框架,需先安装,编写简单代码即可启动。核心要点:启动前切换到目标目录、注意端口占用、停止用Ctrl + C。
2026-01-18 10:25:19
918
原创 ubuntu18可以直接升级到22版本吗
不能直接升级到 22.04,必须通过 20.04 作为中间版本分步升级。升级前务必备份数据、更新当前系统、关闭第三方 PPA,这是避免失败的核心。生产环境优先选择重新部署而非升级,更稳定且可控。
2026-01-06 17:36:36
636
原创 Docker GPG 密钥下载失败如何处理
则是问题,核心原因是网络连接 / SSL 握手异常(Ubuntu 18.04 自带的 OpenSSL 版本较旧,或网络访问受限)。
2026-01-06 12:42:51
311
原创 iTunes Lookup API 规则具体(查包名)
查包名用bundleId参数,查数字 Apple ID 用id参数,别混用;仅能查上架 App,未上架测试包返回空;仅返回公开信息,隐私数据(如开发者真实身份)查不到;按频率限制调用,避免 IP 封禁。
2025-12-30 22:10:16
879
原创 通俗讲解苹果ios购买沙盒环境作用和搭建流程
沙盒环境的价值最简搭建关键1. 不花真实钱;2. 模拟真实购买流程;3. 验证代码逻辑是否正常1. 建沙盒测试账号;2. 手机用沙盒账号买;3. 服务端指定沙盒环境验证沙盒环境让你用「假账号、假支付、假收据」,测通「真代码、真流程」,上线后换成生产环境即可。那如果在生产环境中开启了沙盒模式,是不是就用假账号、假支付、假收据购买了真商品?哪怕不小心把生产环境的代码写成了真实用户的生产收据传到沙盒接口 → 返回 21008 错误 → 验证失败 → 不会发货 / 扣费;
2025-12-30 21:21:31
1033
原创 如何在沙盒环境中进行内购测试
沙盒内购测试的核心是「专用测试账号 + 沙盒接口验证 + 全流程覆盖」:先创建沙盒测试账号,配置设备和 App,客户端触发沙盒支付,服务端验证沙盒收据,最后测试关键场景。确保每一步的环境(沙盒 / 生产)匹配,避免 21007/21008 等验证错误。
2025-12-30 20:44:15
1469
原创 什么是苹果官方提供的沙盒环境
沙盒环境就是 iOS 内购的「测试专用环境」,核心价值是无真实资金交易、独立测试、适配苹果审核。在代码中必须区分沙盒 / 生产环境,否则会导致收据验证失败(21007/21008 错误)。
2025-12-30 20:37:18
489
原创 iOS 内购收据验证的基础实现
该代码是 iOS 内购验证的核心逻辑,优化后增加了异常处理、自动环境切换、结果解析、日志记录等生产级特性,可直接集成到业务系统中。区分沙盒 / 生产环境;校验防止重复发货;解析状态码并处理异常;订阅类商品需传递共享密钥。
2025-12-30 20:33:20
578
原创 多提问题能否增强模型回答准确度
单纯 “多提问题” 没用,关键是 “提高质量问题 + 记录反馈 + 针对性优化”;优先优化 “检索 + Prompt + 文件解析”(低成本、见效快),再考虑模型微调(高成本、长期收益);核心指标:用 “准确率”(正确回答的问题数 / 总问题数)衡量优化效果,目标是逐步提升到 80% 以上。按这个逻辑,你的项目会从 “能运行” 逐步迭代到 “好用、准确”,且每一步都有明确的问题导向,不会盲目优化。
2025-11-24 17:31:30
901
原创 图文并茂的笔记、便签是如何用py开发的
新手想快速实现:选「Python + Flask + Editor.md + PyInstaller」,1-2 天就能做出可用的图文笔记工具;追求原生桌面体验:选「Electron + Python」,适合想做类似 Obsidian 的专业工具;坚持纯 Python:仅适合简单需求,或需深度集成系统功能的场景,否则不推荐。核心思路是「不重复造轮子」—— 用现成的富文本编辑器解决图文排版问题,用 Python 解决本地存储和跨平台打包,高效落地需求。
2025-11-24 16:09:42
792
原创 批量保存浏览器 Network 中请求
chrome-har-capturer` 或 `har-export` 把 HAR 里每个 URL 重新拉取一遍;------------------------------------------------- “整站静态备份,无登录无 JS 动态”→ wget --mirror --span-hosts --convert-links 一条命令解决。--page-requisites 拉取 JS/CSS/图片等“渲染必需品”--convert-links 把外链改成相对路径,离线可点。
2025-11-17 16:58:25
875
原创 LangChain的基础概念
LangChain 是一个用于构建基于大语言模型(LLM)的应用程序的开源框架,核心目标是,让开发者能更高效地构建复杂的 LLM 应用(如问答系统、聊天机器人、RAG 等)。
2025-11-14 11:07:14
203
原创 sentence-transformers和transformers是什么关系
是「基础工具」,覆盖全场景,灵活性高但需手动处理细节。是「专项工具」,基于前者优化,专注句子嵌入,开箱即用。如果任务是生成句子向量,优先用;若需更灵活的模型控制或其他 NLP 任务,直接用。
2025-11-14 11:05:40
339
原创 OpenMP 冲突问题:从易到难解析 + 最简解决方案
先看场景:如果是 “求和、计数、求最值”→ 直接用reduction(最简单,零手动同步);再看变量:如果变量不需要共享→ 用private(从根源避免冲突);最后用critical:如果是复杂场景(写文件、修改数据结构)→ 用critical保护临界区。按这个顺序,能解决 90% 的 OpenMP 冲突问题,且操作最简单,新手无需理解复杂的线程同步原理就能上手。OpenMP 冲突问题和 GPU 环境没有必然关联。
2025-11-14 10:14:54
1228
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅