自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 让 AI 记住我家狗叫「十六」,原来只需要 5 分钟

人们常说 “大模型的能力边界在模型之外”,而记忆,特别是模型长期记忆,就是让 AI 突破边界的关键一步。我认为,AI 不缺知识,也不缺算力,真正缺的是「连续性」—— 一种能跨越会话、理解上下文、记住人和关系的能力。这,正是 MemOS 这样的 AI 记忆系统试图重塑的核心方向。

2025-11-06 21:53:07 777

原创 BendSQL v0.30.3 Web UI 功能介绍

随着大模型迈过拐点,评估方法进入第三阶段,LLM-as-a-Judge,其核心思想是让模型学习人类的主观偏好,即利用一个功能强大的大型语言模型(通常是前沿模型)来扮演裁判的角色,对另一个 AI 模型(或应用)的输出进行评分、排序或选择,即用魔法打败魔法。需要强调的是,不同于奖励模型,云监控 2.0 提供的 LLM-as-a-Judge,是在 SQL/SPL 中调用大模型实现的,具有不需要训练评估模型、可按任务随时修改评估规则、可原生嵌入企业数据的特点,适合轻量场景与快速验证。测试的目标是消灭 bug。

2025-11-06 21:51:55 186

原创 真实迁移案例:从 Azkaban 到 DolphinScheduler 的选型与实践

二是它用 “项目” 来管理任务,非常直观。Azkaban 的插件机制确实不太给力,想接个企业微信告警、对一下内部的 CMDB,或者让它支持 Spark on K8s,基本都得去改源码。后来我们给每个业务线都单独开了账户和 YARN 队列,这下总算清净了,大家各跑各的,谁也不耽误谁。后来我们调整了策略:只给核心任务开实时告警,非核心的就每天汇总一下,发个邮件同步,清爽多了。Azkaban 用在小团队、任务不复杂的时候还行,一旦数据平台规模上来了、团队变多了,就会发现它的架构有点跟不上了,各种限制就冒出来了。

2025-11-05 19:16:59 716

原创 LLM 时代,DataAgent × WhaleTunnel 如何将数据库变更瞬时 “转译” 为洞察?

内置 LLM 服务,实现自然语言至 SQL 转化,自动生成查询并解释结果,并深度整合 Snowsight UI,让 "问数据" 重新变成一场自然的对话。,智能推断字段映射与增量策略,自动生成配置后,进入图形界面,直观验证与微调 DAG,实现 Prompt 到数据同步任务的平滑过渡。如果说 ChatGPT 带来了 "文本的智能理解",那么 DataAgent 的出现,则代表了 "数据的智能行动"。这些场景的本质,是让系统不再需要被 "操作",而能主动地 "协作" 与 "学习"。

2025-11-05 19:15:38 630

原创 RWKV7-G0a3 7.2B 发布:迄今最强 RNN,高并发 vibe coding

​ 当今世界,最火的技术无疑是 AI 了,AI 的出现极大的提高了生产力,可谓是重构了生产方式。同时,活字格具备高扩展性,支持数据库直连、Web API、OAuth2.0 认证及编程扩展,结合模块化开发方式,促进系统集成与数据互通,避免信息孤岛,为业务升级与运维扩展奠定基础。的制造业生产系统,如果使用传统编码的方式去开发的话,300 个人月也不一定能够完成,而采用活字格低代码平台却在 60 个人月的时间里,即可完成快速搭建上线,整体效率提升 500%。例如,上海格心开发的 "智造云" 平台,一个拥有。

2025-11-04 19:15:13 740

原创 EloqCloud for EloqDoc:成本降低 10 倍的文档数据库 DBaSS 服务

由于每个 EBS 卷在每个计算节点上维护三个副本,一个标准的三节点副本集最终会拥有总共九个存储副本,导致过度的存储开销和成本。**EloqCloud for EloqDoc 利用对象存储作为其主要数据层,并使用本地 NVMe SSD 进行缓存,** 与依赖多个副本和基于 EBS 存储的 MongoDB Atlas 相比,实现了显著的成本节约。通过用云对象存储替代 EBS,EloqDoc 将存储费用降低了高达 10 倍,同时提供内置的跨可用区持久性 —— 且无需额外的复制开销。

2025-11-04 19:14:15 503

原创 Dify 性能瓶颈?Higress AI 网关为它注入「高可用之魂」!

Higress AI 网关是外界与企业 AI 应用、企业 AI 应用与大语言模型服务和 MCP 服务的桥梁,旨在解决模型集成复杂、安全合规难、管理效率低等挑战,提供统一治理入口。1. 协议标准化:将差异化的模型 API 统一转换为 OpenAI 兼容格式2. 可观测体系:提供 Token 级监控(QPS / 成功率 / 耗时)和请求全链路追踪3. 安全防护层:实现 API-KEY 自动轮转、JWT 认证、敏感内容实时拦截4. 稳定性引擎:集成多级 Fallback、AI 缓存、Token 限流等治理能力。

2025-11-03 16:51:10 830

原创 理解 SOLID 原则:编写更简洁的 JavaScript 代码

即使在小型 JavaScript 项目中,SRP 也能培养良好的编码习惯,提升长期可维护性。即使没有静态类型检查,JavaScript 开发者也能通过合理设计类层级、明确行为约定和可替换性,从 LSP 中获益。每个职责的修改理由都不同(比如业务规则变更、数据库逻辑调整、邮件服务升级),违背了 "单一职责" 的核心要求。应用 ISP 后,代码会更简洁、聚焦,且随着项目增长,可维护性会显著提升。这种设计能提升可维护性、避免代码臃肿,并让单个行为的扩展和测试更简单。:一个模块、类或函数,只应有一个修改的理由。

2025-11-03 16:49:56 660

原创 在 LazyLLM 中使用 Milvus

以上代码中主要实现了 RAG 系统中的启动和检索环节,对于检索环节,使用字典的形式实现了 kv cache 机制,检索开始时首先会检查当前查询的节点是否已经在缓存当中,如果存在,即为缓存命中,直接取缓存中的查询结果即可,反之则进行正常的检索流程,并在最后将检索结果存入缓存当中。可以看到,当系统没有缓存查询结果时,每次查询的时间均在 1 点几秒,而使用缓存的情况下,除了第一次正常检索,其余检索均在瞬间完成,因此,合理设计缓存机制能够在高效的向量索引基础之上进一步提升系统检索性能。接下来我们分别进行实践。

2025-11-02 17:36:27 702

原创 LazyLLM 教程 | 第 12 讲:实践:用缓存、异步与向量引擎加速你的 RAG

在实际的使用过程中,用户只需要在 Document 定义阶段配置 store_conf 参数,进行简单的存储和检索配置,即可利用这两种数据库将文档处理后的数据存储于本地,并在下次系统启动时直接从本地加载这些数据,避免文档的重复入库,实现知识库持久化存储。⚒️chroma:使用 ChromaDB 存储数据,ChromaDB 是一个更轻量的向量数据库,相比于 Milvus 能处理的数据量级有限,适合调试,更多 ChromoDB 相关信息可以参考 ChromaDB 官方文档;type:使用存储类型。

2025-11-02 17:35:20 840

原创 PerimeterX CAPTCHA 解决方案

Bright Data 的 CAPTCHA Solver支持高级自定义,可根据特定使用场景微调解题逻辑。事件监控: 检测到 CAPTCHA 并开始解决。: 成功解决 CAPTCHA。: CAPTCHA 解决失败。价格方案方案价格(每 1K 结果)月度费用描述按需付费$1.50无承诺非常适合零散、临时的爬取需求。Growth$1.27$499专为成长型团队打造。Business$1.12$999适用于大规模爬取操作。Premium$1.05$1,999提供高级功能及优先支持。

2025-11-02 17:34:06 1146

原创 AIO Sandbox:为 AI Agent 打造的一体化、可定制的沙箱环境

CDP (Chrome Devtools Protocol)是一种用于与 Chrome 或 Chromium 浏览器通信的协议,通过 WebSocket 提供浏览器控制 API,可以执行导航与加载、DOM 操作、JS 执行 / 调试、网络拦截与模拟、截图与渲染、安全与权限等。将 GUI 操作抽象为可组合的最小原子动作,如移动鼠标、点击、拖动、滚动、按键、输入文本,以及额外的工具函数如等待,尽可能对齐 VLM 视觉模型在执行实际动作的一致性。AIO 以统一镜像基座,用约定式路由和服务配置支持按需扩展。

2025-11-02 17:32:31 872

原创 Meilisearch — Rust 打造的轻量级搜索新锐 | 搜索百科

Meilisearch 的出现,代表了新一代搜索引擎对于开发者体验和即时性的追求。它在应用内搜索领域展现了强大的竞争力,证明了不必依赖 Lucene 的庞大体系,也能打造出极致性能的搜索产品。虽然它还无法完全取代 Elasticsearch 在日志分析、可观测性等大型分布式场景的地位,但在许多新兴应用和对搜索速度有极高要求的场景中,它无疑是一个值得尝试的开源新星。

2025-11-02 17:31:20 813

原创 MySQL 迁移至 GreatSQL 后,timestamp 字段插入报错解析

对于为这样的列指定 NULL 的插入,如果启用了严格的 SQL 模式,则结果是单行插入错误,如果禁用了严格的 SQL 模式,则会插入 '0000-00-00 00:00:00'。3、第一个之后的 TIMESTAMP 列,如果没有显式地使用 NULL 属性或显式的 DEFAULT 属性声明,将自动声明为 DEFAULT '0000-00-00 00:00:00'("零" 时间戳)。对于没有为这样的列指定显式值的插入行,将为该列分配 '0000-00-00 00:00:00',并且不会出现警告。

2025-10-31 20:09:50 283

原创 使用 LangExtract 和 Elasticsearch

为了演示 LangExtract 和 Elasticsearch 如何协同工作,我们将使用一个包含 10 份不同类型合同的数据集。这些合同包含标准数据,如费用、金额、日期、期限和承包方。我们将使用 LangExtract 从合同中提取结构化数据,并将其作为字段存储在 Elasticsearch 中,从而可以对其运行查询和筛选。你可以在这里找到完整的 notebook。

2025-10-31 20:08:33 477

原创 从 “纸笔清单” 到全栈引擎:数据填报与类 Excel 控件如何重塑企业效率曲线 | 葡萄城技术团队

GCExcel 是葡萄城基于 Java/.NET 的高性能服务端表格组件,与 SpreadJS 前后端天然兼容,构成 "全栈 Excel 解决方案" 的核心引擎(出处:葡萄城产品介绍文档)。

2025-10-31 20:07:36 439

原创 开发者必备 SVG 手册:从入门到 Path 实战,图标、动画、自适应一次搞定 | 葡萄城技术团队

通过网络解锁器,你可以轻松抓取最具防护性的网站。浏览器(Chrome、Firefox、Edge 等)反指纹浏览器(Adspower、Multilogin 等)自动化工具(Puppeteer、Playwright、Selenium 等)

2025-10-31 20:02:53 444

原创 GPU 网络基础,Part 2(MoE 训练中的网络挑战;什么是前、后端网络;什么是东西向、南北向流量)

最后,它通过批量计算簇内向量与查询向量之间的距离,来探索每个簇中包含的向量。这意味着我们可以直接从文件中读取向量到内存中进行优化的向量运算,从而带来相当不错的性能。由于向量被大量量化,这只会增加极少的磁盘开销,并且在搜索过程中需要探索的质心更少。如果你需要非常非常高的召回率,有大量堆外内存(或者愿意为此付费),且索引更新较少(因此索引成本低),使用带有某种量化的 HNSW 仍可能是最佳选择。然而,如果你能接受 95% 或更低的召回率,对成本敏感,但仍希望快速搜索,DiskBBQ 可能是你的解决方案。

2025-10-31 19:53:57 303

原创 从 “盲调” 到 “精准优化”:SQL Server 表统计信息实战指南

即 broker5 代替了 broker3 的位置,由于集群总 broker 数目不变,因此 broker3 身上的大部分 bundles 经过 hash 算法计算,得到的 index 还是原来的值(2),因此 broker3 身上的绝大部分 bundles 都会转移到 broker5 身上,如果该 broker 刚好是新加入的 broker,负载不高,那情况很好,但如果该 broker 是负载相对较高的 broker,则可能导致它的负载超高,只能后面通过 shedding 来均衡负载。

2025-10-30 16:15:35 873

原创 SQL 审核工具深度体验(一): CloudDM vs Archery vs Yearning vs Bytebase

Archery 不能调试工单,也不具备事务模式,这意味着在处理强一致性的 "数据订正" 工单时,DBA 需要格外谨慎。Bytebase 在递交工单时可以手动对 SQL 进行检查,需要先 "运行检查",再点击 "检查结果图标",方可查看检查结果,结果中会显示问题 SQL 所在行。CloudDM 支持工单调试功能,在 "数据订正" 场景里,即使遇到预设的报错,也可以人工介入处理,再继续执行后续 SQL,而不是简单地中断执行。默认情况下,查询控制台只能执行查询语句,DDL/DML 需要通过工单才能执行。

2025-10-30 16:14:13 617

原创 一场 MCP 生态的变革 —— 详解 OpenTiny NEXT 逆向思维的技术创新

OpenTiny NEXT 支持将海量的企业前端应用转变为 MCP 工具,实现智能化改造,这将极大丰富 MCP 的生态。我们提供低成本、轻量化的企业应用智能化改造方案,通过运用逆向思维将 MCP Server 放在前端运行,解决了 GUI 方案存在的性能等问题。我们不仅支持 Web 应用,还通过 WebView 支持桌面应用、移动应用甚至鸿蒙应用。除 TypeScript 外,我们将陆续推出 MCP 官方支持的其他语言版本,助力企业应用低本高效智能化转型。

2025-10-30 16:13:15 1667

原创 平衡尺度:利用权重使倒数排序融合 (RRF) 更加智能

浏览器插件(Extensions 或 Add-ons)是一类运行于。

2025-10-30 16:11:30 611

原创 原来联邦学习也会 “泄密”?CVPR 爆出重磅攻击方法!开源隐私计算 SecretFlow

首先根据客户端分享的梯度信息进行标签的推断,推断的标签作为条件同待优化的隐藏矢量 z 一起输入预训练好的图像生成器,生成器生成重构的图像,生成的图像和推断的标签作为输入送到联邦学习模型进行梯度计算,并经过梯度转化方法估计,生成扰动的梯度与真实共享的梯度进行距离度量计算损失函数,该损失函数加上正则项构成总的损失函数,采用两种优化方法进行对 z 的更新。因此我们可以根据梯度信息进行标签的推断。用 x 表示原始数据,用 y 表示梯度信息,F 表示梯度计算过程,c 为标签信息,fθ 为联邦学习的模型。

2025-10-30 16:10:45 524

原创 借助 ChatGPT API 将 AI 集成到测试自动化框架中

相比依赖硬编码值,ChatGPT 能提供丰富且真实的数据集 ------ 从包含家庭信息的用户档案,到精密科学领域使用的专属数据均可生成。关键是将 ChatGPT API 的判定结果视为建议,最终决策由自动化框架根据设定的阈值做出 ------ 例如,仅当置信度高于 0.8 时,才判定测试失败。在大多数这类测试中,团队期望调用某个 REST 接口后,特定消息能出现在应用控制台、DataDog 或 Loggly 等日志工具中 ------ 这类测试在团队进行白盒测试时非常必要。

2025-10-29 18:33:15 811

原创 在 Elasticsearch 中部署多语言嵌入模型

他们可以输入 “l'impatto dei social media sul discorso politico”(意大利语)或 “ảnh hưởng của mạng xã hội đối với diễn ngôn chính trị”(越南语)这样的查询,并找到用英语、西班牙语或任何已索引语言撰写的相关论文。可选地,如果你想使用其他文本嵌入模型,也是可以的。为了演示,我们将把每个翻译版本作为一个独立的文档进行索引,并附上第一个可用的英文翻译作为参考。的前 100 行加载到本地 JSON 文件中。

2025-10-29 18:32:33 578

原创 网络请求错误处理

图例插入标识:React Native 异步操作错误处理流程示意图] 流程节点:发起异步操作(setItem/getItem)→ try 块执行操作 → 成功:返回结果 / 失败:catch 捕获 → 错误上报 → 用户提示 / 降级处理。仅在应用内处理错误不够,还需建立完善的监控体系,实时收集错误信息,以便定位问题并优化。常用方案分为 “自建监控” 和 “第三方监控” 两类。React Native 中的异步操作(如。、文件系统操作)需通过。

2025-10-29 18:31:44 783

原创 React Native 错误处理完全指南 | 葡萄城技术团队

这类错误发生在 iOS 或 Android 的原生代码中,常见于自定义原生模块、第三方原生库兼容性问题、原生 API 调用不当等场景,例如:iOS 中数组越界、Android 中空指针异常、原生模块向 JS 传递非法数据等。是 React Native 内置的 JS 错误捕获工具,可全局监听未被错误边界捕获的 JS 错误(包括异步操作错误),相当于 JS 层的 “最后一道防线”。:它无法捕获异步操作(如 setTimeout、Promise)、事件处理器中的错误及服务器端渲染错误。捕获未处理的异常,通过。

2025-10-29 18:31:11 673

原创 隐语 SecreFlow:如何全面提升 MPC 多方安全学习的性能?

通讯量轮数内存有效模拟范围误差大小耗时在固定场景 SEMI2K FM128 下进行测试,因为 exp prime 目前仅支持该场景。exp pade 方法:初版高精度的 exp 模拟方法,强制启用了下限和上限的 clamping。代号为 mod 1。exp taylor 方法:基于泰勒级数的模拟方法,可以通过调节迭代次数控制精度。迭代次数越多,性能越差。本次测试使用泰勒 - 8 参数。预期性能大大优于 pade 方法,但精度较差,没有 clamping。代号为 mod 2。

2025-10-29 18:30:16 609

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除