- 博客(238)
- 资源 (2)
- 收藏
- 关注
原创 Nginx源码分析(25篇)
Nginx源码分析 - 初探Nginx的架构 Nginx源码分析 - 基础数据结构篇 - 内存池 ngx_palloc.c Nginx源码分析 - 基础数据结构篇 - 数组结构 ngx_array.c Nginx源码分析 - 基础数据结构篇 - 缓冲区结构 ngx_buf.c Nginx源码分析 - 基础数据结构篇 - 双向链表结构 ngx_queue.c Nginx源码分析 ......
2018-09-19 19:36:17
89714
转载 随机森林算法及其实现(Random Forest)
阅读目录1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Python实现 8 参考内容回到顶部1 什么是随机森林? 作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销...
2018-09-04 16:36:06
380654
38
转载 Flink架构、原理与部署测试
Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台,它能够基于同一个Flink运行时,提供支持流处理和批处理两种类型应用的功能。现有的开源计算方案,会把流处理和批处理作为两种不同的应用类型,因为它们所提供的SLA(Service-Level-Aggreement)是完全不相同的:流处理一般需要支持低延迟、Exactly-once保证,而批处理需要支持高吞吐、高效处理...
2018-09-04 14:12:36
8089
1
原创 在 Windows 上通过 OpenClaw 控制浏览器的几种方法
OpenClaw 在 Windows 上提供了灵活多样的浏览器控制方案:从本地隔离的托管浏览器,到接管现有页面的扩展中继,再到远程 CDP 和云端托管,基本覆盖了所有使用场景。通过 Chrome DevTools Protocol(CDP),让 OpenClaw 接管一个已经用 --remote-debugging-port 参数启动的浏览器实例,适合远程服务器或局域网浏览器的控制。通过 Browserless.io 等云端 Chromium 服务,无需本地安装浏览器,适合服务器资源有限的场景。
2026-03-04 11:00:11
4003
2
原创 OpenClaw CLI 和配置文件参考:完整指南
它不会触及磁盘上的会话文件,只会处理发送给模型的内容。这正是 GitHub 问题 #2254 中记录的模式的根本原因:35 条消息生成了一个 2.9MB 的会话文件和一个包含 208,467 个令牌的上下文,当超出模型 200k 的限制时,上下文会静默停止响应。“大多数”这个词很重要——请参阅下面的热重载部分,了解哪些更改需要重启,哪些不需要,因为在生产环境中,静默失败的热重载常常会造成混乱。没有警告模式,也没有优雅降级:如果您添加了架构中不存在的键,网关将无法启动,并且错误消息会指向错误的键。
2026-03-04 10:57:24
1869
原创 OpenClaw 的免费 AI 大模型及其配置方法
本地模型可以处理繁琐的日常任务,而备用方案则可以应对“我需要更强大的处理器来处理这个问题”或“我的本地服务器繁忙”的情况。如果你使用的是免费套餐,除非你确定它能满足你的使用需求,否则建议将其作为备用方案而非主要方案。我不会用它来管理整个团队的免费业务,但对于个人经纪人来说,它可能是一个不错的选择。本指南篇幅较长,因为模型配置看似简单,但一旦遇到问题,例如工具调用速度变慢、出现 429 错误,或者某个代理使用的身份验证配置文件与预期不符等,就会发现其中的奥妙。从隐私和成本角度来看,这是最简洁的方案。
2026-03-04 10:45:04
2297
原创 OpenClaw 内存的工作原理以及如何控制它
这意味着,如果您使用的是同一个代理工作区,那么您在 Telegram 中设置的偏好设置,在您通过 WhatsApp 或 Discord 私信发送消息时仍然有效。它会将数据写入你电脑上的文件。OpenClaw 通过在需要缩小或总结正在进行的对话之前,将持续存在的片段捕获到内存中来解决这个问题。内存文件存储在磁盘上,这固然是好事,但也意味着您需要进行基本的安全加固。如果你要在 WhatsApp、Telegram 和 Discord 上运行它,内存就显得尤为重要,因为它将所有功能连接起来,请参阅。
2026-03-04 10:40:20
544
原创 如何为 OpenClaw 添加语音功能,支持 TTS、STT 和通话模式?
最简洁的方案是将网关部署在你需要稳定性的地方,例如服务器,然后将麦克风部分部署在与之配对的设备(macOS、iOS、Android)上。当收到包含音频的邮件时,OpenClaw 会先选择第一个符合条件的附件,然后检查大小限制,再按顺序尝试各种模型,直到找到一个可用的为止。这就是“语音命令”的由来,因为转录文本可以包含斜杠命令,这些命令的行为就像你手动输入的一样。“为 OpenClaw 添加语音功能”听起来像是一个单一的功能,但当你尝试设置时就会发现,它实际上是由三个独立的部分组成的,而这三个部分恰好相邻。
2026-03-04 10:38:44
4855
原创 用OpenClaw提取本地PDF摘要和内容
同一个“invoice.pdf”文件,可能是一个干净、可选择的文本文件,也可能是一个扫描混乱、表格格式错误、间距随意的文件。因此,OpenClaw PDF 工作流程的最佳处理方式是将 PDF 文件视为流程的输入,而不仅仅是“需要汇总的文档”。对于 PDF 文件,这意味着繁重的处理工作(解析、OCR、提取、编辑)都可以在本地完成,您只需选择是否将生成的文本或结构化输出发送给模型即可。即使没有隐藏文本,文档也可能具有“语义恶意”,也就是说,它会呈现看似合理的数字或表格,意图欺骗用户。多栏PDF会打乱阅读顺序。
2026-03-04 10:36:27
2106
原创 OpenClaw 自定义 API 集成指南(适用于技能和插件)
您可以将几乎任何REST API、CLI工具、SaaS平台、数据库、Webhook源或内部系统连接到您的代理。大多数 SaaS 集成都属于这一类:GitHub、Stripe、天气 API、航班跟踪器、CRM 端点、内部仪表板。,以便理解网关、代理、工具和模型层。中描述的 systemd 生产环境设置进行操作,则您的 Gateway 已经支持插件加载。代理程序仅在需要时加载该文件,即使您安装了许多技能,也能保持上下文的高效性。从那里,您可以安装技能、插件或配置 webhook,而无需额外的引导工作。
2026-03-04 10:29:35
651
原创 OpenClaw 短信和 iMessage 设置指南(Twilio、BlueBubbles、imsg)
它提供用于发送消息的 API,并可以发送接收消息的 Webhook,包括群聊标识符和消息元数据。而 iMessage 可以是一对一的,也可以是群聊,还可以是参与者不断变化的完整对话。对于少量或中等量的短信来说,这没什么问题,但如果你打算像聊天软件一样整天使用短信,你就会明显感觉到费用上涨了。此外,您还将获得一个来自 Twilio 的 Webhook,用于向您的服务器发送入站消息,以及一个用于发送出站消息的 REST API。消息正文不应该出现在冗长的调试日志中,它们总会在最糟糕的时刻泄露敏感信息。
2026-03-03 16:22:54
1375
原创 使用 OpenClaw 提取数据并自动化网络任务
Playwright 提供了“connect”和“connectOverCDP”两种方法来连接到现有的浏览器实例,但它也指出,CDP 连接的精度可能低于 Playwright 自身的协议。如果您通过 CDP 连接到现有的 Chromium 实例,请记住,基于 CDP 的连接与完整的 Playwright 协议连接的行为可能有所不同。网站会轮换令牌,导致您的个人资料被重置,或者状态存储在您的自动化配置文件未保存的位置。如果网站主动阻止自动化操作,您将花费大量时间与之对抗,而且您的行为可能仍然违反他们的条款。
2026-03-03 16:21:23
2122
1
原创 在 OpenClaw 中保护您的 API 密钥:密钥管理指南
实际上,这意味着:一个 Anthropic 密钥用于您的主代理,一个单独的密钥用于后台定时任务代理(可能需要使用受限权限),Telegram 和 Discord 的机器人令牌按频道分配,Gmail 和 Google 日历集成使用单独的 OAuth 凭据。对于在公共通道中运行且输入未经信任的代理,即使代理的 API 密钥拥有更广泛的权限,也应在工具的允许/拒绝配置中拒绝执行和 Webhook 工具。更好的做法是为每个集成和每个代理使用单独的密钥,并限制其权限范围,使其仅包含实际所需的最低权限。
2026-03-03 16:19:27
5002
1
原创 OpenClaw故障排除指南:常见错误的修复
它是一个基于 Node.js 的代理框架,包含一个长时间运行的网关进程、多个通道适配器、一个内存层、一个 cron 调度器、Webhook 路由以及模型提供程序,而这些组件都可能以各自独特的方式出现故障。如果重启网关,会话上下文就会丢失。如果您的转换在单独运行时有效,但在 OpenClaw 中失败,请检查路径是否在允许的目录范围内,以及 TypeScript 编译是否已正确配置。如果您添加了新的提供商或切换到不同的模型,但忘记更新此列表,则所有引用该模型的操作都会静默失败,或者返回“模型不允许”的错误。
2026-03-03 16:16:48
3314
原创 OpenClaw 中的高级内存管理:QMD、图、mem0
如果你的内存使用场景主要是“查找与此查询相关的笔记”,那么 QMD 是一个合适的起点。Cognee 是一款开源的内存引擎,它正是为此而设计的:它读取你的 Markdown 内存文件,提取实体和关系,构建图,并提供基于图的搜索模式,这些模式可以通过遍历连接而非仅仅匹配向量来回答问题。最大的问题在于关系性:如果你周一写了“Alice 管理认证团队”,周五又问“谁负责认证权限”,纯粹的向量搜索可能会搜出一些关于 Alice 的信息片段和一些关于认证的信息片段,但它无法将这些信息关联起来,形成一个连贯的答案。
2026-03-03 16:15:40
3414
原创 OpenClaw Webhook 详解:完整指南
无需等待您主动发送消息,GitHub 可以在 PR 提交时通知 OpenClaw,Stripe 可以在支付失败时通知 OpenClaw,n8n 也可以按计划通知 OpenClaw。OpenClaw 会接收这些传入事件,并将其转换为代理运行或轻量级唤醒操作,然后将结果路由回您实际使用的任何渠道。Stripe Webhook 是一个很好的例子,因为它在 Stripe 端内置了签名验证机制,并且事件类型系统非常清晰。实际问题是这样的:你的 webhook 发送方触发了一个事件,但你的网关正在重启。
2026-03-03 16:13:02
3015
原创 OpenClaw 和 GitHub 自动化,用于 PR 审核和 CI 监控
这并非指模糊的“AI 会帮你写代码”,而是指那些枯燥的日常工作,例如:“哪里出错了”、“哪里发生了变化”、“哪些需要我审核”、“这个 PR 添加了测试吗”以及“为什么流水线失败了”。你也可以在这里进行基本的分类。它不应该“批准所有内容”,而应该总结变更内容,指出风险,并指出明显的疏漏,例如“未更改任何测试”或“此更改涉及身份验证”,然后由您决定如何处理。从更高层来看,你希望助手能够进行轻量级的问题分类:区分缺陷和功能请求,应用标签,在问题显而易见的情况下指定负责人,并将那些难以判断的问题留给人工处理。
2026-03-03 16:10:58
1322
原创 大规模运行 OpenClaw:Docker、Kubernetes 和高可用性设置
例如,如果您配置了 Telegram 机器人令牌,所有三个网关副本都将拥有相同的令牌,但 Telegram 一次只能将消息发送到一个活动的 Webhook 端点。一台配置良好的单台 VPS,配合 systemd、完善的监控和定期备份,就能处理绝大多数实际工作负载,而无需 Kubernetes 那样复杂的运维。中讨论的高级内存后端(QMD、Cognee、Mem0),则这些服务应该各自拥有独立的持久性证书 (PVC),并且最好作为独立的部署运行,而不是与网关捆绑在一起。这里的管理模式是使用单独的。
2026-03-03 16:09:08
2251
原创 如何将 OpenClaw 调大模型成本降低 90% 或更多?
如果您不重视模型选择和会话维护,即使只是一个代理每隔几分钟检查一次心跳,运行一些定时任务,并处理两三个渠道的对话会话,每月也很容易产生 50 到 150 美元的 API 费用。OpenClaw 的默认心跳配置会定期触发,而且,如果你还没注意到的话,它会使用你的代理默认使用的任何模型。如果您的客服人员定义了 20 个工具,但只经常使用其中的 3 个,那么剩下的 17 个未使用的工具定义会在每次通话中都增加输入令牌。对于基于任务的工作流来说,这是最佳选择,因为每个会话都有明确的范围,无需保留完整的历史记录。
2026-03-03 16:06:11
1444
原创 OpenClaw cron 调度器指南,实现主动自动化
另一个例子是每周回顾,它会在一个独立的会话中运行,并且只会将最终结果返回给您。如果不询问,最终你会在早上 7 点收到一条时区错误的消息,然后你会因为错误的原因讨厌 cron。这不仅仅是“早上7点运行一个脚本”,而是“唤醒代理,运行提示符或将系统事件发送到主会话,然后将输出发送到我实际能看到的地方”。如果您更喜欢聊天驱动的设置,也可以直接告诉客服您的需求,客服可以为您创建任务。有时,您希望 cron 执行一些纯粹的内部工作,例如刷新本地缓存或运行维护分析,而这些分析仅在需要时才需要检查。
2026-03-03 16:00:15
1697
原创 利用 OpenClaw 的日程安排和分析功能实现社交媒体自动化
但如果你已经使用 OpenClaw 进行真正的自动化操作,那么社交媒体发帖就会变得更加有趣,但如果你没有设置相应的安全措施,也会变得更加危险。例如,你可以使用 X 的 API 将内容发布到 X,使用 Meta 的发布 API 将内容发布到 Instagram,使用 LinkedIn 的 API 将内容发布到 LinkedIn。在 OpenClaw 领域,PostFast 是最简洁的例子,因为它采用 API 优先的流程,并使用工作区范围的密钥。你的 X 平台帖子以一段简短的陈述和一个链接结尾。
2026-03-02 11:10:47
993
1
原创 OpenClaw 数据隐私:GDPR、HIPAA 和合规指南
将 OpenClaw 托管在欧盟境内的 VPS 服务器上(例如芬兰的 Hetzner、法国的 OVH,或者如果您在罗马尼亚,可以选择任何一家罗马尼亚的服务器),可以确定您的静态数据存储位置。这是一项不断发展的法律,如果您在欧盟开展业务,则值得密切关注。对于基于 OTEL 的监控,代理可观测性框架中标记的合规性和安全性检查维度转化为对异常数据模式的警报:数据量出现意外峰值,可能表明工具访问的数据比预期的要多,或者 PII 模式出现在不应该出现的地方。根据 GDPR,同意必须是自愿的、具体的、知情的且明确的。
2026-03-02 11:05:42
1312
原创 使用 Ollama 在本地免费运行 OpenClaw
OpenClaw 的提供商文档中也包含 Ollama 快速入门指南,以及一个容易让人困惑的关键细节:即使 Ollama 本身并不验证 API 密钥值,OpenClaw 仍然要求该密钥值存在。它还列出了启动器的功能:如果需要,通过 npm 安装 OpenClaw,显示安全提示,选择模型,然后配置并启动网关。否则,您可能会破坏工具格式,导致出现“OpenClaw 已损坏”的提示,而实际上这只是您自定义的提示。如果想要“快速的日常操作”,建议为这些代理设置较小的上下文,而只为深度分析代理设置较大的上下文。
2026-03-02 11:04:14
5017
原创 使用 OpenClaw 在电脑上实现文件管理自动化
这超出了本指南的范围,但关键在于:问题不在于PDF文件本身,而在于PDF的类型。实际上,两者都会用到。如果想要最安全的配置,请在隔离环境中运行 OpenClaw,并仅挂载您希望它管理的目录。我们大多数人把它当作临时的落脚点,然后它悄悄地变成了第二个桌面,再加上第三个压缩文件,以及“那张发票的存放处”。你可以在技能文件夹内的脚本文件中实现“组织”逻辑,也可以保持提示驱动的方式,让技能直接定义规则和允许的二进制文件。除非您显式连接云同步工具或向外部发送提示的模型提供商,否则您的文件内容将保留在您的计算机上。
2026-03-02 11:02:42
1459
原创 OpenClaw 多智能体设置,包含多个 AI 助手
实际上,这意味着:如果您依赖于个性规则或冗长的偏好设置文件,则应该将关键信息放入 AGENTS.md 文件中,或者将其包含在子代理的任务提示中。这也是我喜欢使用一个协调代理的原因,它的任务是“分解任务并生成工作进程”,并在 AGENTS.md 文件中保存一组关于工作进程所需内容的简短指令。代理向导是最简便的方法,因为它会自动搭建工作区并创建一个干净的代理目录。这是一个“枯燥但有效”的方案。Slack 非常适合绑定一个仅用于工作的代理,因为您可以保持其专业性,限制其记忆内容仅与工作相关,并锁定其使用的工具。
2026-03-02 11:01:06
1879
原创 OpenClaw 数据、设置和内存备份指南
目标很简单:即使你的 VPS 在凌晨 3 点宕机,你也能恢复备份,你的助手也能像什么都没发生过一样正常运行。对于 24/7 全天候运行的服务来说,这通常是最佳方案,因为它可以在不长时间停机的情况下提供一致的视图。它还支持客户端加密。如果你想深入了解密码学,Filippo Valsorda 写了一篇详细的文章,分析了 restic 的文件加密格式和先加密后 MAC 的设计。如果你在 VPS 或家庭实验室机器上运行 OpenClaw,那么 restic 和 Borg 是常见的选择,因为它们可编写脚本且可靠。
2026-03-02 10:59:35
2430
原创 OpenClaw 技能指南:安装、构建并避免风险捆绑包
如果您从 ClawHub 安装了一个技能,之后又创建了一个同名的工作区技能,OpenClaw 会识别工作区副本,即使 ClawHub 安装的技能仍然存在于磁盘上,您仍然会感觉像是 ClawHub 安装“停止工作”了。在这种情况下,您可以启动一个新的会话,或者启用技能监视器,以便检测到更改并刷新快照。我见过太多次同样的套路:有人安装了 OpenClaw,运行了一些任务,顿时觉得“哇哦”,然后两天后,他们又得重新开始维护它,因为代理程序总是偏离目标。清晰的默认值、清晰的停止条件,以及在缺少输入时清晰的提问。
2026-03-02 10:56:44
945
原创 如何为自己的自动化流程构建自定义 OpenClaw 技能
本文讲解的是如何编写自己的技能,而不是安装社区提供的技能,也不是列出“你应该使用的技能列表”。本文着重讲解一些实用技巧:文件夹应该放在哪里,优先级机制如何运作,frontmatter 中哪些字段是重要的,如何设置访问门槛,如何让技能以斜杠命令的形式显示,以及如何避免令牌开销过大。OpenClaw 的技能文档提到,它会加载捆绑的和可选的覆盖项,然后注入摘要。该页面还解释说,OpenClaw 会加载捆绑的技能以及本地覆盖设置,然后根据环境、配置和 PATH 中的二进制文件来筛选适用技能。务必保持功能范围明确。
2026-03-02 10:54:51
938
原创 OpenClaw 自定义 API 集成指南(适用于技能和插件)
您可以将几乎任何REST API、CLI工具、SaaS平台、数据库、Webhook源或内部系统连接到您的代理。大多数 SaaS 集成都属于这一类:GitHub、Stripe、天气 API、航班跟踪器、CRM 端点、内部仪表板。,以便理解网关、代理、工具和模型层。中描述的 systemd 生产环境设置进行操作,则您的 Gateway 已经支持插件加载。代理程序仅在需要时加载该文件,即使您安装了许多技能,也能保持上下文的高效性。从那里,您可以安装技能、插件或配置 webhook,而无需额外的引导工作。
2026-03-02 10:44:18
2652
原创 什么是 OpenClaw(Moltbot)以及它的工作原理
OpenClaw(前身为 Clawdbot 和 Moltbot)是一款开源的、可自行托管的 AI 代理,旨在保持持续在线、跨对话记忆,并在其运行的系统上执行实际操作。你给它设定一个目标,它会将目标分解成若干步骤,然后决定需要哪些工具,使用这些工具,评估结果,并持续执行,直到达到停止点。本文解释了 OpenClaw 是什么,它的工作原理,它与典型的 AI 工具有何不同,以及为什么这么多人将其从笔记本电脑迁移到服务器上。OpenClaw 会记住昨天、上周或上个月发生的事情,而这些记忆会影响它接下来的行为。
2026-03-02 10:42:34
1160
原创 一文详解大模型推理加速与优化
大语言模型 (LLM) 因其在各种任务中的卓越表现而备受关注。然而大语言模型的部署推理并不简单,尤其是针对在给定资源受限场景下,巨大的计算和内存需求给LLM推理部署带来了挑战,具体如:高延迟、低吞吐、高存储等。
2026-01-08 14:48:04
883
原创 SpringBoot+Prometheus+Grafana实现应用监控和报警
这套监控功能还是挺强大的,就是Prometheus的表达式有点多。附上几个链接:Prometheus官方文档Grafana官方文档代码地址。
2026-01-07 15:35:17
446
原创 CPU/GPU/TPU/NPU傻傻分不清楚
而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?,只是对CPU的结构进行了优化与调整,所以现在GPU不仅可以在图像处理领域大显身手,它还被用来科学计算、密码破解、数值分析,海量数据处理(排序,Map-Reduce等),金融分析等需要大规模并行计算的领域。NPU — Neural Network Processing Unit,神经网络处理器,是基于神经网络算法与加速的新型处理器总称,如中科院计算所/寒武纪公司出品的diannao系列。
2026-01-06 20:29:10
1309
原创 在windows上用cmake编译geos库
cmakevs2019https://github.com/libgeos/geos/releases找到对应的版本
2025-11-21 10:30:22
284
原创 如何通过AI获取微信聊天记录克隆一个你自己:做自动化智能客服(1)?
不仅实现了对微信群内关键内容的快速抓取,还能精准总结特定成员在某段时间内的发言,真正解决了“重要内容被埋没”的痛点。目前通义千问 Qwen3 模型不仅可以在阿里云百炼平台上直接体验模型,智能体和工作流内也已接入 Qwen3 模型,可以将 Qwen3 结合知识库,插件,MCP 能力,创建更强大的 AI Agent。可以看到,他先调用了时间,然后再群聊中筛选了记录,成功的总结了大佬的语录,并且进行了一个详细的输出。AI 不再只是一个“助手”,而正在成为理解你社交数据、整理重要信息、优化信息流的“智能秘书”。
2025-11-12 11:32:18
1230
原创 探索K8s与AI的结合:PyTorch训练任务在k8s上调度实践
Kubernetes的核心优势在于其能够提供一个可扩展、灵活且高度可配置的平台,使得应用程序的部署、扩展和管理变得前所未有的简单。通用计算能力方面的应用已经相对成熟,云原生化的应用程序、数据库和其他服务可以轻松部署在Kubernetes环境中,实现高可用性和弹性。然而,当涉及到异构计算资源时,情形便开始变得复杂。异构计算资源如GPU、FPGA和NPU,虽然能够提供巨大的计算优势,尤其是在处理特定类型的计算密集型任务时,但它们的集成和管理却不像通用计算资源那样简单。
2025-11-12 10:39:51
1006
转载 基于k8s部署满血版Deepseek-R1的实践指南
资源隔离:为每个推理实例分配独立GPU,避免多租户干扰预热策略:启动时预加载模型到GPU显存,减少首请求延迟自动伸缩:基于HPA实现动态扩缩容,CPU利用率阈值设为70%备份机制:定期将检查点保存至对象存储(如MinIO)通过上述方案,可在K8s环境实现Deepseek-R1的稳定运行,实测QPS可达120(batch_size=32时),端到端延迟控制在1.2秒以内。建议每两周进行一次模型热更新,采用蓝绿部署策略确保服务连续性。rag。
2025-11-12 10:32:27
198
原创 大模型AI Agent开发框架LangChain1.0
LangChain 在 1.0 版本中,将所有 Agent 的创建方式统一为了一个入口——create_agent()。它取代了旧版本中的 create_react_agent、create_json_agent、create_tool_calling_agent 等多种分支函数,真正让开发者用一行代码即可创建任何类型的智能体。在 LangChain 0.x 时代,框架内的 Agent 系统经历了“碎片化”阶段。
2025-11-11 11:49:31
1689
原创 如何用Dify实现智能问答?
由于文档被分块存储,rag检索时通过参数Top K用来控制返回的分块数,一般包含docId、splitContent等字段,Score是通过Document中会有一个打分,对每一个分块根据用户输入来打分,提高精准度。经过提示词不断的优化,文档的添加,效果达标后,可以发布,并通过API接口的形式调用服务,实现前端页面自定义、需求自定义!A1:因为混合检索包含向量、关键字检索两种方式,效果会更好些,其中还有排序模型用来精排"定顺序"!输入用户问题,点击测试即可看到效果,经过验证,回答内容与源文档一致。
2025-11-11 10:36:14
742
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅