- 博客(152)
- 收藏
- 关注

原创 【RRF】递归排序融合 1 / (k + i) 核心思想
关键参数:K 控制权重衰减速度;i 文档在当前排名列表中位置;RRF目标是多个排名列表合并为一个统一的排名;核心思想:高排名文档权重更大、低排名文档权重更小;多个列表的贡献叠加
2025-03-14 14:17:31
690

原创 【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别
本文讲解了LangChain智能体如何定义Tool,以及智能体类型ReAct和Self-Ask的示例、区别
2025-03-05 11:11:23
1524
1
原创 【网络】select、poll和epoll模型的区别
select、poll 轮询所有描述符,且复制多;epoll 仅处理有事件描述符,仅传递描述Id
2025-06-04 16:00:00
534
原创 【Netty】EventLoopGroup
通过分离bossGroup和职责分离:连接接收与I/O处理分开,避免阻塞。性能优化:充分利用多核CPU,提升吞吐量。简化并发:单线程处理每个连接的事件,降低开发复杂度。这种设计是Netty高性能和易用性的核心之一。
2025-06-01 19:26:01
336
原创 【Redis】Hash 存储相比 String 存储的优势
在 Redis 中,如果你的数据是一个对象结构,并且你希望:节省内存、支持字段级更新、提升可维护性,那么推荐Hash
2025-05-19 14:47:23
411
原创 【算法】滑动窗口动态查找不含重复字符的最长子串
经典的滑动窗口(Sliding Window) 问题,可以通过维护一个窗口来动态查找不含重复字符的最长子串
2025-05-19 14:44:46
369
原创 【MySQL】索引太多会怎样?
MySQL索引太多的不利影响:增加存储、内存占用、影响写入、查询性能、误导索引优化器、维护成本高(DDL、备份、恢复)
2025-05-16 23:20:14
655
原创 【Redis】谈谈Redis的设计
Remote Dictionary Service (Re Di S)内存访问、单线程无锁、精心优化的数据结构
2025-05-13 20:21:45
910
原创 【Redis】集群槽位为什么是16384个?
Redis槽位数:16384(即 2^14),这一设计决策背后有多个技术考量,主要涉及网络通信效率、内存开销、集群规模限制以及历史设计权衡
2025-05-08 12:10:02
945
原创 【Arthas】从类加载、代码调试、系统监控到性能分析的一站式解决方案
Arthas Java诊断工具,通过命令组合,可以高效解决线上问题,无需重启或重新部署应用
2025-05-07 11:26:00
619
原创 【Arthas】火焰图优化应用CPU(问题原因:获取调用栈)
获取调用栈是同步阻塞操作,涉及JVM遍历线程栈帧,性能开销大(尤其在频繁调用的场景)
2025-05-03 18:46:04
493
原创 【SpringCloudAlibaba】Dubbo 和 Spring Cloud OpenFeign 在服务治理能力上的差异
Dubbo:适合高性能、高并发的内部服务调用(如金融、电商)。OpenFeign:适合需要与 HTTP 生态兼容的场景(如多云协作、前后端分离)
2025-04-27 16:14:09
994
原创 【设计模式区别】装饰器模式和适配器模式区别
两者设目的不同:适配器模式通过改变接口达到重复使用的目的;而装饰器模式不是改变原接口,而是保留原接口,但增强原油对象的功能或性能。
2025-04-26 16:32:17
669
原创 【Elasticsearch】索引设计要点
在 Elasticsearch 中设计索引时,需要结合业务需求、数据特性、查询模式和性能要求进行综合考虑。2.2 分词策略(Analyzer)分词器选择:示例:为商品名称字段配置中文分词器:2.3 索引设置分片(Shards)与副本(Replicas):刷新间隔(refresh_interval):2.4 索引生命周期管理(ILM)滚动
2025-04-26 10:58:07
778
原创 【RabbitMQ】消息堆积与K8s HPA动态扩缩消费者
通过 Prometheus 监控 RabbitMQ 队列,然后通过 k8s-prometheus-adapter 将指标暴露给 HPA。编写一个服务定期检查 RabbitMQ 队列长度通过 Kubernetes API 直接调整 Deployment 的副本数或者调用 HPA 的 API 修改目标值。
2025-04-25 10:08:50
1159
原创 【缓存与数据库结合方案】伪从技术 vs 直接同步/MQ方案的深度对比
直接同步修改或通过MQ消息队列也能实现类似同步功能,但伪从技术(通过消费binlog实现数据同步)在某些场景下具有独特优势
2025-04-24 10:32:58
1147
原创 【Coze】Coze JWTOAuth对接
JWT(JSON Web Token)模式,扣子账号直接永久授予 OAuth App 权限,OAuth App 随时可以通过后端应用签发的 JWT 获取访问令牌,以后端应用的身份请求扣子 API。
2025-03-16 22:30:36
479
原创 【RAG】混合检索(Hybrid Search) 提高检索精度
RAG基于 RRF 的融合排序,融合向量检索、关键词检索 等检索算法,提高检索精度
2025-03-09 22:38:22
1074
原创 【RAG】检索后排序 提高回答精度
RAG 有时最合适结果并非最位于最前,此时:通过检索时过召回一部分文本、通过一个排序模型对 query 和 document 重新打分排序,可以提高检索精度
2025-03-09 22:24:06
752
原创 【向量模型】 开源通用向量模型BGE (BAAI General Embedding)
BGE为各类信息检索及大语言模型检索增强应用而打造,本文从多个维度详细解析 BGE 的特点与应用
2025-03-09 21:22:34
2852
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人