# 2025年11月18日 Cloudflare 全球大故障:一个“文件太大”就把半个互联网搞瘫痪了?
大家好,今天早上(北京时间11月18日晚到19日凌晨),很多人突然发现:刷X(推特)刷不了、ChatGPT问不出问题、Spotify听不了歌、甚至一些银行和电商网站都打不开……一堆网站集体显示“Cloudflare 内部错误”。
没错,这就是 Cloudflare 的一次全球性大故障,影响范围之广,堪称2025年最尴尬的互联网事故之一。Cloudflare 官方已经在博客里发了详细的事后报告(RCA),我仔细读完后,用最通俗的话给大家掰扯清楚:**到底是怎么回事?为什么一个小 bug 能把全球互联网搞得鸡飞狗跳?**
### 先说结论:罪魁祸首就是一个“超重的特征文件”
Cloudflare 有个很重要的功能叫 **Bot Management(机器人管理)**,简单说就是用机器学习模型帮网站分辨“人是人,机器人是机器人”,防止爬虫、恶意刷单、DDoS 攻击等。
这个模型不是一成不变的,它需要每隔几分钟就更新一个叫“**特征文件(feature file)**”的东西,里面装了几万个判断机器人行为的“特征”。这个文件会像快递一样,快速推送到 Cloudflare 全球几百个数据中心的每一台服务器上。
11月18日 UTC 11:05(北京时间19:05左右),工程师在某个数据库(ClickHouse)里改了个权限设置。
这个改动本身很小,但导致数据库在查询时**把同一批数据重复吐了两遍**,于是生成的特征文件直接**胖了一倍**!
更要命的是,Cloudflare 服务器上读取这个文件的程序有个“硬编码的大小上限”,它压根没想到文件会突然变这么胖。文件一超重,程序直接报错崩溃 → Bot Management 模块挂了 → 整个核心代理系统(负责转发网站流量的那部分)也跟着罢工 → 大量网站返回 5xx 错误(服务器内部错误)。
用大白话总结:
**就像你家路由器里塞了个太大的配置文件,导致路由器直接死机,全家 Wi-Fi 都没了。**
### 为什么影响这么大?半个互联网都中招了?
因为 Cloudflare 实在是太重要了:
- 全球大约 20% 的网站流量都经过 Cloudflare(CDN + 安全防护 + DNS)
- X、ChatGPT、Spotify、Discord、Shopify、League of Legends……一大票头部网站都在用它
- 它不仅仅是“加速器”,还是“门卫+消防员”,一旦门卫罢工,网站就直接“关门谢客”
这次故障从 UTC 11:20 开始,短短几分钟就扩散到全球所有数据中心。到 UTC 14:30 核心流量才恢复正常,完全恢复要到 17:06,持续了近6个小时。
### 修复过程:一开始还以为是被超级 DDoS 攻击了
工程师第一反应:这症状太像被史上最大规模的 DDoS 攻击了!(毕竟最近有叫“Aisuru”的攻击团伙很活跃)
结果排查半天发现:不是攻击,就是自己家数据库权限改错了……
他们赶紧做了三件事:
1. 停止推送这个超大文件
2. 把旧的正常文件强行塞回去
3. 重启相关服务、清理缓存
流量很快就恢复了。
### 这次事故给我们普通人什么启发?
1. **互联网其实很脆弱**:大家总觉得上网天经地义,但其实全靠几家巨头在背后撑着。AWS 上个月刚挂过,Azure 前阵子也出过事,今天轮到 Cloudflare。真应了那句话:“把所有鸡蛋放在一个篮子里,篮子摔了就全完蛋。”
2. **再牛的公司也会翻车**:Cloudflare 上次这么严重的全球核心流量中断还是2019年,这次间隔6年又来一次。官方在博客里说得很诚恳:“我们让大家失望了,这对我们团队来说非常痛苦,我们会吸取教训,绝不再犯。”
3. **多备份、多云才是王道**:如果你是站长或开发者,建议关键服务别只依赖一家 CDN,开启 Multi-CDN 或至少准备好备用 DNS。普通用户?也没啥好办法,只能等他们修……(手动狗头)
### Cloudflare 承诺会怎么改进?
官方说已经在做:
- 数据库权限变更要更严格审查
- 数据库查询结果要自动去重
- 特征文件大小加实时校验,超了就报警而不是直接推送到生产
- 给文件推送加“紧急停止开关”,下次出事能秒停
- 程序里那个硬编码的大小上限直接取消,改成动态的
总之,就是一堆“下次绝不再犯”的标准操作。
写在最后:
互联网时代,我们每天都在享受“巨人们的肩膀”,但偶尔他们打个喷嚏,我们就得集体感冒。这次事件再次提醒大家:**去中心化、多备份、做好灾难恢复预案**,永远不过时。**
希望 Cloudflare 说到做到,下次别再让我们早上刷不了 X、问不了 ChatGPT 了……(手动再见)
(参考:Cloudflare 官方事后报告 https://blog.cloudflare.com/18-november-2025-outage/ )

被折叠的 条评论
为什么被折叠?



