自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 为了解决前面遇到的这些问题,我们重新设计了负载均衡算法。首先,从卸载策略 LoadSheddingStrategy 开始入手。

即 broker5 代替了 broker3 的位置,由于集群总 broker 数目不变,因此 broker3 身上的大部分 bundles 经过 hash 算法计算,得到的 index 还是原来的值(2),因此 broker3 身上的绝大部分 bundles 都会转移到 broker5 身上,如果该 broker 刚好是新加入的 broker,负载不高,那情况很好,但如果该 broker 是负载相对较高的 broker,则可能导致它的负载超高,只能后面通过 shedding 来均衡负载。

2025-11-06 22:03:39 874

原创 SQL 审核工具深度体验(一): CloudDM vs Archery vs Yearning vs Bytebase

子账号如果在可视化操作过程中没有对应权限,系统会帮助用户快速创建对应的工单,方便继续走流程。CloudDM 支持工单调试功能,在 "数据订正" 场景里,即使遇到预设的报错,也可以人工介入处理,再继续执行后续 SQL,而不是简单地中断执行。工单创建时,CloudDM 会自动检查 SQL,并明显地提示检查结果,标出问题 SQL 所在行。有多条语句的情况下,定位问题很快,改起来也方便。通过修改环境策略,CloudDM 可以禁止环境中数据源的工单功能,在只提供查询的环境中,可以更好地保证数据库的安全。

2025-11-06 22:02:17 587

原创 探讨超长上下文推理的潜力

例如,假设有一个大语言模型能够存储相当于数月工作内容的上下文,我们可以结合 "sleep-time compute"[10] 机制:让模型利用(可预设的)空闲时间,将新获取的信息与既有知识建立关联进行学习。(译者注:这个框架的核心逻辑大概是,模型在完成任务时,先试几次 ---> 记录每次的结果和评估分数 ---> 用一个 "反思提示词" 让模型自己总结经验 ---> 把经验写成 "lesson" ---> 存起来,下次遇到类似任务时用上 ---> 不断迭代优化。当模型能够即时响应时,实验迭代非常轻松。

2025-11-05 19:20:41 630

原创 AI 为什么不认识 Excel 文件?—— 用 SpreadJS 与 GCExcel 打通 AI 与数据的鸿沟

当下,很多企业已经把 AI 接入到业务系统:合同用 AI 审核、知识库用 AI 问答、文档用 AI 总结。你会发现 ——Word、PDF、图片,AI 基本都能 “看懂”;唯独一到 Excel,常常提示 “不支持” 或 “内容不完整”。为什么 AI 对 Excel “犯迷糊”?如何让 AI 像人一样理解、加工并回写表格数据?

2025-11-05 19:19:21 801

原创 对 GPT 5 模型路由机制的深度解析

笔者测试过 "快速总结" 与 "深度剖析" 等具有细微差异的不同措辞,能清晰观察到 GPT-5 在实时切换处理模式 ------ 这仿佛解锁了新的 "软指令" 层,用户措辞对路由决策的影响程度,已不亚于系统内置的启发式规则。其背后的智能 "路由器" 会将每个问题分配给最合适的处理模块:轻量级核心模型瞬间处理各类简单问题和总结摘要类任务,重量级的 GPT-5 思考模型则专攻复杂推理,而需要工具支持时,"路由器" 会启动计算器或外部检索功能。GPT-5 的路由器则截然不同,它能在运行时动态做出决策。

2025-11-04 19:23:33 1762

原创 玩转 OurBMC 第二十四期:玩转 OurBMC 之 BMC 前端模式

当你深入研究 OpenBMC 的代码或部署时,可能会在 WebUI 的配置目录中发现一些以.env.ourbmc”、“.env.intel” 等命名的配置文件以及 env 目录下面还有导航,store,路由,风格配置,均以”ourbmc”,”intel” 这样的名字命名。

2025-11-04 19:21:54 592

原创 PostgreSQL 从参数调优到 AI 诊断的实战指南

与 Hash Join 需要将整个构建表加载到内存不同,Merge Join 在合并阶段采用流式处理,每次仅需缓存当前比较的记录,大幅降低内存占用 | | 缺点 | 返回的结果集大,效率低。的工作方式类似于 Oracle 的 AWR(Automatic Workload Repository),在指定时间间隔内生成快照,并通过 HTML 报告展示这些快照之间的统计数据差异,从而实现深入的性能分析和优化。向下看,可以看到表的连接方式,例如 Hash Join,类似于其他数据库的技术。

2025-11-03 16:59:15 837

原创 SeaTunnel Databend Sink Connector CDC 功能实现详解

【代码】SeaTunnel Databend Sink Connector CDC 功能实现详解。

2025-11-03 16:56:44 350

原创 Apex AI 辅助编码助手的设计和实践|得物技术

Apex 通过 RuleSync 与 ProjectService 实现 CursorRules 规则模板一键同步,依托配置化 MCP 加速工具集成和能力提升,以安全令牌与白名单机制强化治理,并借助 UsageRecorder 与 TraceService 提供可观测性,全面支持高效、安全、可控的使用交付与版本去迭代化管理。Apex 的核心在于 “把 AI 真正落在工程实践之中”,以插件为载体打通认证、上下文、CursorRules 规则和 Cursor;以 MCP 为能力边界实现 “配置即扩展”;

2025-11-02 17:46:44 375

原创 vivo 前端三剑客发展历程及原理揭秘

远程调试工具是基于开源工具 chii 进行二次封装,相较于 vConsole,chii 让跨设备、跨网络的 Web 应用调试变得简单便捷。通过远程连接的方式,像本地数据线连接手机一样,在本地的 chrome Devtools 中进行问题定位,实现和在chrome://inspect 中一样的设备调试效果。远程调试工具很好的解决了开发因为本地无法复现,需要测试同学手上特定机器才能复现的问题,同时可以在远程看到页面实时运行的日志、接口等信息,大大提升问题定位效率。下面是整个操作步骤。

2025-11-02 17:45:47 754

原创 Eino ADK:一文搞定 AI Agent 核心设计模式,从 0 到 1 搭建智能体系统

Eino ADK是一个专为 Go 语言设计的 Agent 和 Multi-Agent 开发框架,设计上参考了Google-ADK中对 Agent 与协作机制的定义。少写胶水:统一接口与事件流,复杂任务拆解更自然。快速编排:预设范式 + 工作流,分分钟搭好管线。更可控:可中断、可恢复、可审计,Agent 协作过程 “看得见”。无论你是 AI 应用的新手,还是经验丰富的开发者,ADK 都能为你提供合适的工具和模式。

2025-11-02 17:44:46 1838

原创 从一次启动失败深入剖析:Spring 循环依赖的真相|得物技术

什么是 Bean 循环依赖?循环依赖:说白是一个或多个对象实例之间存在直接或间接的依赖关系,这种依赖关系构成了构成一个环形调用,主要有如下几种情况。第一种情况:自己依赖自己的直接依赖第二种情况:两个对象之间的直接依赖前面两种情况的直接循环依赖比较直观,非常好识别,但是第三种间接循环依赖的情况有时候因为业务代码调用层级很深,不容易识别出来。循环依赖场景@Service@Service结果:项目启动失败抛出异常 BeanCurrentlyInCreationException。

2025-11-02 17:43:44 803

原创 提升 Web 端 JavaScript 的可信度:WAICT 体系详解

在谈安全保障之前,首先必须明确 “网页应用(web application)” 是什么。智能手机上的应用可以看作一个压缩包 (zip);网页则由相互关联的资源组成 ——HTML、JavaScript、WASM、CSS 等,这些资源既可能来自本域,也可能来自外域;而任一资源变化,都可能大幅改变应用行为。应用必须对其所加载的资源做出承诺(commit)。也就是说,需要有机制让浏览器知道 “这是这个应用应该加载的资源集合”。下面我们先从 “完整性(Integrity)” 谈起。

2025-11-02 17:42:09 672

原创 基本数据类型Go 的基本数据类型分为 4 大类,相比于 Java 更简洁且明确:

Go 的基本数据类型分为intint8int16int32int64intint8uintuint8uint16uint32uint64uintptruintptrfloat32float64float64complex64complex128float32float64booltruefalsestringbyteuint8runeint32Go 和 Java 同样都是,要求在确定所有变量的类型,且类型不可在运行时动态改变。Go 不允许任何隐式类型转换(如int32到int64。

2025-10-31 20:19:24 428

原创 国人自研开源隐私计算框架 SecretFlow,深度拆解框架及使用【开发者必看】

* 当然,这一切取决于设备提供的计算能力。为达到这个目标,** 隐语提供了一层设备抽象,** 将多方安全计算 (MPC)、同态加密 (HE) 和可信执行环境 (TEE) 等隐私计算技术抽象为密文设备, 将单方计算抽象为明文设备。提供了统一的设备调度抽象,将上层算法描述为一张有向无环图,其中节点表示某个设备上的计算,边表示设备之间的数据流动,即逻辑计算图。有隐私计算算法开发诉求的同学,可以根据自身场景和业务的特点,设计出一些特化的隐私计算算法,来满足自身业务和场景对安全性、计算性能和计算精度的平衡。

2025-10-31 20:18:17 355

原创 HarmonyOS 5.0 应用开发 ——V2 装饰器 @param 的使用

子组件中有一个按钮展示 @param 装饰的 count,但是不能更新本地的 count,父组件中有一个按钮展示 @local 装饰的 count,并且与子组件的 count 绑定,形成单向通信效果。点击父组件按钮会更新父子两者的组件显示数据。在下面案例中点击子组件按钮的时候 in 的 count 值已经发生了修改,父组件中的 count 也会修改,只不过 @param 和 @local 没有观察到,当先点击子组件按钮再点击父组件按钮的时候就会观察到两者显示 10--12--14 .

2025-10-31 20:17:15 277

原创 所有网站通用:6 行 HTML 代码搞定页面加载提速

把这段 HTML 标签塞进你网站的 `` 里,就能实现近乎瞬间的页面跳转体验!有没有过这种感觉:点个链接,下一页 “唰” 地就出来了?这种神奇的秒开体验,现在靠 Chrome 的就能轻松实现。这个全新的浏览器特性,只用几行 HTML 就能让页面导航快到飞起。

2025-10-31 20:16:05 420

原创 Java25 的新特性

JDK25 作为第十轮 incubator,主要变化是:VectorShuffle 现在支持访问和访问 MemorySegment,该实现是通过 Foreign Function & Memory API (JEP 454) 而不是通过 HotSpot 内部的 C++ 代码,提高了可维护性,另外对 Float16 值的加法、减法、除法、乘法、平方根和 fused 乘法 / 加法运算现在支持 x64 cpu 自动矢量化。(3) 读取的值是由 Framework.serve 的时候写入的。

2025-10-31 20:15:00 424

原创 Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

在 Oinone 后端中,通过@Module声明模块,并在引导配置里声明最小模块集@Module(displayName = "Demo工程",// 依赖只指向“API/模型定义”与基础模块# application/bootstrap.yml(模块最小集)pamirs:boot:init: truesync: truemodules:- base- demo_core # 你的业务模块。

2025-10-30 15:58:52 804

原创 Raft 中的 IO 执行顺序:内存状态与持久化状态的陷阱

Raft 论文的抽象模型(只关注持久化状态)和实际实现(内存状态 + 持久化状态)之间存在微妙的映射关系。关键不变式:log entry (term=T) 在磁盘 → persisted_term ≥ T 也必须在磁盘消除 IO-reorder:原子批处理、有序执行或混合方式(主流实现)处理 IO-reorder:检查持久化状态,等待必要的 IO 完成。

2025-10-30 15:58:14 780

原创 将 GPU 级性能带到企业级 Java:CUDA 集成实用指南

统一计算设备架构(CUDA)是 NVIDIA 的并行计算平台与 API 模型,允许开发者在 NVIDIA GPU 上实现大规模并行执行的软件。它通常通过 C 或 C++ 使用,你需要编写在 GPU 上并行运行的 "内核(kernel)"。数据并行工作负载(如图像处理、金融仿真、日志转换)细粒度并行(成千上万线程)对计算受限操作的加速。

2025-10-30 15:57:05 740

原创 介绍一种新的向量存储格式:DiskBBQ

最后,它通过批量计算簇内向量与查询向量之间的距离,来探索每个簇中包含的向量。这意味着我们可以直接从文件中读取向量到内存中进行优化的向量运算,从而带来相当不错的性能。由于向量被大量量化,这只会增加极少的磁盘开销,并且在搜索过程中需要探索的质心更少。如果你需要非常非常高的召回率,有大量堆外内存(或者愿意为此付费),且索引更新较少(因此索引成本低),使用带有某种量化的 HNSW 仍可能是最佳选择。然而,如果你能接受 95% 或更低的召回率,对成本敏感,但仍希望快速搜索,DiskBBQ 可能是你的解决方案。

2025-10-30 15:56:25 995

原创 LazyLLM 教程 | 第 10 讲:探索 Deepseek:打造思维能力更强的 RAG 系统

我们使用 DeepSeek-R1 来对小模型进行蒸馏,其过程大致如下图所示:首先我们选取 GSM8K 数据集,使用其训练集中的题目来不断喂给 DeepSeek-R1 来获得用于训练的问答对,在获得蒸馏训练集后为了查看思维链在其中的效果,我们还单独剔除了数据集中的思维链来作为另外一个训练集,基于这两个训练集分别微调出两个小模型,最后我们对微调后的两个小模型、DeepSeek-R1 以及微调前的小模型进行评测以查看提升效果。至此,这就是基于 LazyLLM 的对 DeepSeek-R1 蒸馏小模型的实现,

2025-10-30 15:55:52 577

原创 Spring 创建 Bean 主要流程

循环依赖暴露了代码结构的设计缺陷。理论上应通过分层和抽象来避免,但在复杂的业务交互中仍难以杜绝。虽然 Spring 利用三级缓存等机制默默解决了这一问题,使程序得以运行,但这绝不应是懈怠设计的借口。我们更应恪守设计原则,从源头规避循环依赖,构建清晰、健康的架构。

2025-10-29 19:04:48 957

原创 从一次启动失败深入剖析:Spring 循环依赖的真相|得物技术

什么是 Bean 循环依赖?循环依赖:说白是一个或多个对象实例之间存在直接或间接的依赖关系,这种依赖关系构成了构成一个环形调用,主要有如下几种情况。第一种情况:自己依赖自己的直接依赖第二种情况:两个对象之间的直接依赖前面两种情况的直接循环依赖比较直观,非常好识别,但是第三种间接循环依赖的情况有时候因为业务代码调用层级很深,不容易识别出来。循环依赖场景@Service@Service结果:项目启动失败抛出异常 BeanCurrentlyInCreationException。

2025-10-29 19:03:13 2300

原创 从 AWS 故障看 DNS 的隐形杀伤力:DeepFlow 如何在混乱中快速锁定根因

DynamoDB 是 AWS 的高性能 NoSQL 数据库服务,许多上层服务(从用户账号、评论、消息、缓存失效逻辑等)都依赖它。此次故障的直接触发点是 DynamoDB API 的 DNS 解析失败 —— 也就是说,即便服务本体没宕机,只是访问地址 “变成了无效域名”,整个服务链就被阻断。一旦这个 “中枢接口” 在 DNS 层被切断,众多上层依赖它的微服务、函数调用、缓存回退逻辑、控制台操作等都无法继续,这就是极为典型的 “单点 DNS 故障 → 多条服务链坍塌” 的场景。

2025-10-29 18:57:54 980

原创 在 Elasticsearch 中解析 JSON 字段

Ingest Pipeline 提供了一组内置处理器,其中包括 json 处理器,可用于解析 JSON 数据。在这个示例中,我们创建了一个名为 json_parser 的 ingest pipeline,它会解析存储在 message 字段中的 JSON 字符串,并将解析后的 JSON 对象存储到一个名为 json_field 的新字段中。完成后,你可以直接运行以下命令,它会遍历索引中的所有文档,从 message 字段中提取 JSON,并将解析后的 JSON 数据索引到 json_field 对象中。

2025-10-29 18:56:28 439

原创 AI 基础设施指南:工具、框架与架构流程

分页注意力通过将注意力键值对存储在非连续内存块中(类似操作系统管理虚拟内存的方式),消除了内存碎片,相比传统方法可减少高达 50% 的内存占用,从而支持更大批处理量和更高的 GPU 利用率。Kong 因丰富的插件生态在 AI 应用中脱颖而出,其插件包括专为 AI 工作负载设计的令牌计数限流、多模型 API 的请求 / 响应转换,以及 AI 指标的全面分析功能。Kubernetes 凭借强大的调度能力、丰富的生态系统及活跃的社区支持,已成为 AI 工作负载编排的事实标准。

2025-10-29 18:53:18 684

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除