- 博客(25)
- 收藏
- 关注
原创 浅谈大模型的记忆与 RAG
兄弟们在平时用AI时不难发现,大模型聊完就忘,这是它的天生缺陷。那么,这篇文章就是讲怎么给它"补忆"——从最简单的塞上下文,到用向量数据库做 RAG 检索,再到一些要注意的地方。
2026-06-17 12:02:15
220
原创 LLM、Token、Prompt、Context、Memory、RAG、MCP、Agent、Skill、Harness ......AI常见概念解读,看这一篇就够了
随着AI的发展,AI 圈的名词也越来越多,什么 LLM、Token、Prompt、Context、Memory、RAG、MCP、Agent、Skill、Harness ......一大堆。:你用 ChatGPT、Claude 的能力,本质上都是在"调 API"——你的程序通过 API 发一条请求,模型处理好结果,通过 API 返回给你。最早的内容会被"挤出去",AI 就忘了。举个例子,你让 Agent"帮我分析竞品的最新动态",它会自己去搜索、整理、对比、生成报告,而不是等你一步步告诉它怎么做。
2026-06-16 15:39:49
180
原创 我必须拿人话讲一讲双亲委派机制
本文深入解析了JVM的双亲委派机制。首先介绍了JVM四大类加载器层级(启动类、扩展类、应用类和自定义类加载器),然后详细阐述了双亲委派机制的工作原理:类加载请求会自下而上逐级委派,顶层加载失败后再向下尝试加载。该机制保证了类的唯一性和安全性,防止核心API被篡改。但也存在类隔离困难、不支持热部署等缺点。文章最后以Tomcat为例,说明其如何通过自定义WebAppClassLoader打破双亲委派,实现Web应用级别的类隔离。理解这一机制对掌握Java底层原理和框架设计至关重要。
2026-05-26 22:07:35
339
原创 分布式 ID 哪家强?吃透雪花不迷茫!
本文系统介绍了分布式ID生成方案及其优缺点对比。首先分析了传统方案(UUID、数据库自增、Redis)的缺陷:UUID占用空间大且无序,数据库自增存在单点故障风险,Redis依赖网络且可能丢失数据。然后重点讲解了雪花算法(Snowflake)的原理和优势,包括64位结构设计、高性能和时序性特点,同时也指出了其机器ID重复和时钟回拨问题。最后介绍了美团Leaf的两种解决方案:Leaf-segment号段模式适合内部非敏感业务,Leaf-snowflake增强版则解决了原生雪花算法的所有生产痛点,成为高并发核心
2026-05-22 17:31:03
356
原创 为什么所有 AI 对话都在用 SSE而不是WebSocket
目前 SSE 已经是 AI 大模型对话的行业通用标准,没有之一。OpenAI 官方流式接口、国内豆包、通义千问、Kimi 等所有主流 AI 产品,全部基于 SSE 实现流式输出。技术选型从不选最强的,只选最合适的。
2026-05-21 21:40:17
370
原创 微信520开放520元红包,让那我们来聊聊支付系统的柔性限流与资金架构
微信在5月20日临时将一对一红包限额从200元提升至520元,次日自动恢复。这一调整体现了支付系统的灵活设计:通过配置中心动态管理限额规则,无需代码修改即可实现节日特殊限额。红包作为社交产品注重高并发处理,采用预冻结资金、异步入账和二倍均值算法等技术;而转账作为金融产品则强调实时账务和强风控。系统通过三层校验机制(时间、场景、风控)确保安全,并采用缓存预加载、降级限流等策略应对节日流量高峰。这种设计在保证资金安全的同时,也兼顾了用户体验和节日仪式感。
2026-05-20 11:50:37
409
原创 一个<think 标签,deepseek真的泄露用户隐私了吗?
这篇文章探讨了在DeepSeek对话系统中输入"<think"时出现的异常输出现象。通过技术分析指出,这种现象并非隐私泄露,而是模型在处理未闭合标签时产生的内部推理碎片外泄。文章从三个层面进行剖析:首先解释了输出内容实质是模型即时生成的思考草稿;其次论证了该现象不涉及用户数据安全问题;最后从技术角度分析了触发机制,指出这是格式解析异常导致的输出过滤失效。作者强调这属于系统稳健性问题而非安全漏洞,建议开发者加强输出过滤机制,同时认为这种现象为理解AI工作方式提供了有趣窗口。文章以理性
2026-05-19 12:29:02
379
原创 10亿条URL的黑名单,如何快速判断一个新请求的URL是否在黑名单内?
布隆过滤器的本质,是“用极小的空间成本,换取极高的查询效率,同时接受轻微的误判”。它不适合所有场景,但在海量数据的存在性判断中,是无可替代的工具。
2026-05-14 21:50:19
335
原创 PostgreSQL安装教程(傻瓜版)
这就是装好了,这个选项主包没勾选,后续再装,finish。选个安装路径,一定要记住这个位置,还有不要有中文。再登录一下看看,主包第一次密码输错了,又输了一次。左图点击环境变量,右图双击系统变量中的Path。复制bin路径加进去,之前说了要记住装哪了。主包装的是15,因为豆包说这个稳定。把这两个加进去,变量名自己取一个。因为是开源的,我们直接去官网。选个存数据的地方,也要记住。以下都不用动,一路next。下载完成后打开,next。这步有点慢,刷视频等一会。然后验证以下有没有装成功。自己设个密码,要记住。
2026-04-27 22:40:21
40
原创 面试官问:MYSQL单表查询很慢,怎么优化?| 看这一篇就够了!
针对sql单表查询慢的问题,我们的解决方案一般是从低成本到高成本一般是先看看能不能改SQL语句和索引,再看看能不能优化表结构,最后才去动用缓存、分表、升级硬件等架构层面的大招。
2026-04-18 16:10:38
369
原创 千问崩了?当大模型遇上“羊毛党”,阿里顶级技术团队也汗流浃背了?
摘要:千问APP因"春节30亿大免单"活动遭遇技术挑战。作为AI应用,其架构原为"慢思考"设计,突变为电商秒杀场景后,面临流量模型突变和数据库压力问题。热点Key导致Redis单节点过载,缓存击穿后MySQL数据库承受巨大压力。解决方案涉及互斥锁和逻辑过期策略,但高并发下的库存扣减仍导致连接池耗尽。这次事件揭示了AI应用在转向交易场景时面临的技术挑战,为行业提供了宝贵经验。(149字)
2026-02-08 23:26:04
650
原创 TRAE国际版全部用户限免一个月领取教程
其中Free用户账号增加600次Fast Request,有效期至北京时间2月14日10:00,Pro用户账号增加800次Fast Request,有效期至北京时间3月14日10:00。登录TRAE官网trae.ai,点击顶部。还没到期的Pro用户,此权益可叠加。今天10:00即可领取,方式如下。权益有效期内所有模型均可使用。
2026-01-14 12:39:38
784
原创 浅谈表空间的文件结构
自底向上看,行:数据库表中的数据记录按行存储页:InnoDB磁盘管理的最小单位,数据库的读取是以页为单位,默认每页大小16KB区:1个区固定1MB段:表空间由段组成,常见的有数据段,索引段,回滚段。
2026-01-05 23:31:32
214
原创 HashMap的大小为什么是2的n次方大小
此处n为4,n - 1 = 3,0011 & 1101 = 0001,为1。扩容前数组长度为4,1+4=5,新索引为5。假设初始oldmap长度为4,二进制为0100,那扩容后的newmap长度为8,二进制1000。此处我们假设某个key的hash为13,二进制就为1101,将hash与oldmap相与,若key的hash为9,对应二进制为1001, 将hash与oldmap相与,原索引为0011 & 1001 = 0001,为1,新索引为1。在小林coding中,下面这段话如何理解,讲一下个人看法。
2025-12-28 20:52:46
294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅