自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(152)
  • 收藏
  • 关注

原创 【RRF】递归排序融合 1 / (k + i) 核心思想

关键参数:K 控制权重衰减速度;i 文档在当前排名列表中位置;RRF目标是多个排名列表合并为一个统一的排名;核心思想:高排名文档权重更大、低排名文档权重更小;多个列表的贡献叠加

2025-03-14 14:17:31 690

原创 【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别

本文讲解了LangChain智能体如何定义Tool,以及智能体类型ReAct和Self-Ask的示例、区别

2025-03-05 11:11:23 1524 1

原创 【Elasticsearch】 查询优化方式

Es查询优化:合理设计字段和映射,减少查询返回的数据量,利用缓存和分页优化等方式

2025-06-05 16:00:00 920

原创 【网络】select、poll和epoll模型的区别

select、poll 轮询所有描述符,且复制多;epoll 仅处理有事件描述符,仅传递描述Id

2025-06-04 16:00:00 534

原创 【Netty】EventLoopGroup

通过分离bossGroup和职责分离:连接接收与I/O处理分开,避免阻塞。性能优化:充分利用多核CPU,提升吞吐量。简化并发:单线程处理每个连接的事件,降低开发复杂度。这种设计是Netty高性能和易用性的核心之一。

2025-06-01 19:26:01 336

原创 【Redis】Hash 存储相比 String 存储的优势

在 Redis 中,如果你的数据是一个对象结构,并且你希望:节省内存、支持字段级更新、提升可维护性,那么推荐Hash

2025-05-19 14:47:23 411

原创 【算法】滑动窗口动态查找不含重复字符的最长子串

经典的滑动窗口(Sliding Window) 问题,可以通过维护一个窗口来动态查找不含重复字符的最长子串

2025-05-19 14:44:46 369

原创 【Java】应对高并发的思路

Java应对高并发思想:资源复用(线程池、连接池)、减少锁竞争、异步化、数据缓存、合理设计(分库表、架构)

2025-05-17 18:02:12 1404

原创 【项目管理】技术与产品的协作方案

从流程、沟通、文档和团队协作等多个方面入手

2025-05-17 10:54:57 838

原创 【MySQL】索引太多会怎样?

MySQL索引太多的不利影响:增加存储、内存占用、影响写入、查询性能、误导索引优化器、维护成本高(DDL、备份、恢复)

2025-05-16 23:20:14 655

原创 【RabbitMQ】消息丢失问题排查与解决

消息丢失可能涉及生产端、传输端(Broker)、消费端等,同时对应有解决方案。

2025-05-16 23:17:56 979

原创 【网络协议】TCP、HTTP、MQTT 和 WebSocket 对比

从协议本质、工作原理、特点、应用场景等方面详细对比。

2025-05-14 18:30:11 1482

原创 【Redis】谈谈Redis的设计

Remote Dictionary Service (Re Di S)内存访问、单线程无锁、精心优化的数据结构

2025-05-13 20:21:45 910

原创 【Redis】RedLock实现原理

若成功获得超过半数节点(如5个中的3个)的锁,且总耗时未超ttl,则锁获取成功。

2025-05-13 20:18:05 828

原创 JVM对象分配与程序崩溃排查

JVM对象分配与程序崩溃排查

2025-05-12 09:59:30 820

原创 【Redis】集群槽位为什么是16384个?

Redis槽位数:16384(即 2^14),这一设计决策背后有多个技术考量,主要涉及网络通信效率、内存开销、集群规模限制以及历史设计权衡

2025-05-08 12:10:02 945

原创 RPC、gRPC和HTTP的区别

RPC底层通信可以使用TCP实现(如Thrift),也可以使用HTTP实现(如gRPC),本身并无限制

2025-05-08 11:17:10 682

原创 【Arthas】从类加载、代码调试、系统监控到性能分析的一站式解决方案

Arthas Java诊断工具,通过命令组合,可以高效解决线上问题,无需重启或重新部署应用

2025-05-07 11:26:00 619

原创 【Arthas】火焰图优化应用CPU(问题原因:获取调用栈)

获取调用栈是同步阻塞操作,涉及JVM遍历线程栈帧,性能开销大(尤其在频繁调用的场景)

2025-05-03 18:46:04 493

原创 【RabbitMQ】保证消息不丢失

需结合 消息持久化、确认机制(ACK)和 死信队列(DLX)实现高可靠性

2025-04-27 16:15:34 1109

原创 【SpringCloudAlibaba】Dubbo 和 Spring Cloud OpenFeign 在服务治理能力上的差异

Dubbo:适合高性能、高并发的内部服务调用(如金融、电商)。OpenFeign:适合需要与 HTTP 生态兼容的场景(如多云协作、前后端分离)

2025-04-27 16:14:09 994

原创 【Neo4j】如何将你的数据变得对RAG更加可用

如何将你的数据变得对RAG更加可用

2025-04-26 18:19:55 129

原创 【设计模式区别】装饰器模式和适配器模式区别

两者设目的不同:适配器模式通过改变接口达到重复使用的目的;而装饰器模式不是改变原接口,而是保留原接口,但增强原油对象的功能或性能。

2025-04-26 16:32:17 669

原创 编译语言、半编译语言(混合型)和非编译语言(解释型)的差异

编译语言直接转机器码运行,解释型逐行执行,半编译混合两者。

2025-04-26 10:59:14 836

原创 【Elasticsearch】索引设计要点

在 Elasticsearch 中设计索引时,需要结合业务需求、数据特性、查询模式和性能要求进行综合考虑。2.2 分词策略(Analyzer)分词器选择:示例:为商品名称字段配置中文分词器:2.3 索引设置分片(Shards)与副本(Replicas):刷新间隔(refresh_interval):2.4 索引生命周期管理(ILM)滚动

2025-04-26 10:58:07 778

原创 【RabbitMQ】任务优先级实现

任务优先级队列、插队队列实现任务优先处理

2025-04-25 10:10:04 739

原创 【RabbitMQ】消息堆积与K8s HPA动态扩缩消费者

通过 Prometheus 监控 RabbitMQ 队列,然后通过 k8s-prometheus-adapter 将指标暴露给 HPA。编写一个服务定期检查 RabbitMQ 队列长度通过 Kubernetes API 直接调整 Deployment 的副本数或者调用 HPA 的 API 修改目标值。

2025-04-25 10:08:50 1159

原创 【高并发】 MySQL锁优化策略

高并发下MySQL锁优化策略

2025-04-24 20:14:12 921

原创 【缓存与数据库结合方案】伪从技术 vs 直接同步/MQ方案的深度对比

直接同步修改或通过MQ消息队列也能实现类似同步功能,但伪从技术(通过消费binlog实现数据同步)在某些场景下具有独特优势

2025-04-24 10:32:58 1147

原创 【缓存与数据库结合最终方案】伪从技术

经过对数据库设计、缓存设计的详细论证,总结并提炼出缓存与数据库结合的最终方案:伪从技术

2025-04-24 10:16:20 692

原创 【缓存击穿】Java的“SingleFlight”解决方案

Golang中的SingleFlight能很好地解决缓存击穿问题

2025-04-07 22:08:00 467

原创 【Redis】如何处理缓存穿透、击穿、雪崩

穿透:布隆过滤器 + 空值缓存。 击穿:分布式锁 + 逻辑过期。 雪崩:随机TTL + 多级缓存

2025-04-02 14:26:02 782

原创 【网络丢包】原因排查及优化

丢包原因:网络拥塞、硬件不足、配置错误、协议特性、网络干扰

2025-03-27 17:20:01 2059

原创 【Golang】defer与recover的组合使用

必须将recover放在defer函数中,才能确保在panic发生后被动调用。

2025-03-22 22:34:29 1202

原创 【Coze】Coze JWTOAuth对接

JWT(JSON Web Token)模式,扣子账号直接永久授予 OAuth App 权限,OAuth App 随时可以通过后端应用签发的 JWT 获取访问令牌,以后端应用的身份请求扣子 API。

2025-03-16 22:30:36 479

原创 【Python】元组和字典的区别

元组 有序、不可变、访问创建速度快,字典 无序 键值对 查找 、插入、删除速度快

2025-03-14 14:03:33 813

原创 【RAG】混合检索(Hybrid Search) 提高检索精度

RAG基于 RRF 的融合排序,融合向量检索、关键词检索 等检索算法,提高检索精度

2025-03-09 22:38:22 1074

原创 【RAG】检索后排序 提高回答精度

RAG 有时最合适结果并非最位于最前,此时:通过检索时过召回一部分文本、通过一个排序模型对 query 和 document 重新打分排序,可以提高检索精度

2025-03-09 22:24:06 752

原创 【RAG】文本分割的粒度

文本分隔粒度,按一定粒度,部分重叠式的切割文本,使上下文更完整

2025-03-09 22:12:17 226

原创 【向量模型】 开源通用向量模型BGE (BAAI General Embedding)

BGE为各类信息检索及大语言模型检索增强应用而打造,本文从多个维度详细解析 BGE 的特点与应用

2025-03-09 21:22:34 2852

LLM大语言模型从理论到实践

介绍了大语言模型在推理规划、智能代理、综合应用框架以及多模态大模型等方面的研究和应用情况,最后介绍大语言模型推理优化方法。

2025-02-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除