即时消息：如何确保消息聊天的安全性_即时通信系统的消息存储的隐私性-CSDN博客

如果说消息的“实时性”、“投递可靠性”、“时序一致性”是评价一个即时消息服务可用性和先进性的重要指标，那么“安全性”就是一个IM服务能否存在的底线和立命之本。

对于依托即时消息技术之上的各种私密聊天App、轨迹位置服务、远程工控系统等业务，对于安全性的需求远高于一般业务。

毕竟，没有人能接受私密的聊天内容被第三方窥探，实时位置的暴露甚至可能带来人身方面的安全风险，而涉及了重要的远程工控操作，如果操作被截获或者篡改，可能会导致严重的工程事故。

消息安全性的三个维度

到底有哪些环节可能导致消息安全的问题呢？

一般来说，从消息的产生和流转的细分上，我们大概从三个维度来描述消息的安全性：消息传输安全性、消息存储安全性、消息内容安全性。

如何保证消息传输安全性

传输安全性这个比较好理解，存在网络交互的即时消息服务，大多需要通过开放网络来进行消息和信令的传输。

可能导致出现安全风险的地方相对也比较多，比如，DNS劫持会导致发往IM服务的请求被拦截发到其他服务器，导致内容泄露或者失效；或者明文传输的消息内容被中间设备劫持后篡改内容，再发往IM服务器引起业务错误等问题。

在消息传输过程中，我们主要关注两个问题：“访问如果安全”和“传输链路安全”，这也是两个基于互联网的即时消息场景下的重要防范点。

保证访问入口安全：HttpDNS

对于即时消息服务，一般都会提供一个公网的“接入服务”，作为用户消息收发的出入口，并通过域名的方式提供给客户端。对于这个出入口的访问，经常也会由于各种原因导致“访问不了”“地址错误”的问题。

对于访问入口，比较常见的问题是DNS劫持。针对接入域名的DNS劫持问题的常见原因有如下两类：

第一类是路由器的DNS设置被非法侵入篡改了。这种问题常见于一些家用宽带路由器。由于安全性设置不够（比如使用默认密码），导致路由器被黑客或者木马修改了，DNS设为恶意的DNS地址，这些有问题的DNS服务器会在你访问某些网站时返回仿冒内容，或者植入弹窗广告等
第二类是运营商LocalDNS可能导致接入域名的解析被劫持。比如下面三种比较典型的情况。
- LocalDNS是部分运营商为了降低跨网流量，缓存部分域名的指向内容，把域名强行指向自己的内容缓存服务的IP地址
- 运营商可能会修改DNS的TTL(Time-To-Live，DNS 缓存时间)，导致DNS的变更生效延迟，影响服务可用性
- 一些小运营商为了减轻自身的资源压力，把DNS请求转发给其他运营商去解析。这样分配的IP地址可能存在跨运营商访问的问题，导致请求变慢甚至不可用

那么，如果防止DNS劫持呢？
（1）对于宽带路由器的DNS设置被篡改的问题：一般重置一下路由器的配置，然后修改默认路由器的登录密码，基本上都能解决

（2）解决运营商 LocalDNS 的域名劫持和调度错误

业界比较常用的方案有HttpDNS。HttpDNS绕开了运营商的LocalDNS，通过HTTP协议（而不是基于UDP的DNS标准协议）来直接和DNS服务器交互，能有效防止域名被运营商劫持的问题
而且由于 HttpDNS 服务器能获取到真实的用户出口 IP，所以能选择离用户更近的节点进行接入，或者一次返回多个接入 IP，让客户端通过测速等方式选择速度更快的接入 IP，因此整体上接入调度也更精准。
当然，调度精准的另一个前提是 HttpDNS 服务自身需要有比较全的 IP 库来支持。目前很多大厂也基本都支持 HttpDNS 为主，运营商 LocalDNS 为辅的模式了，像很多第三方云厂商也提供对外的 HttpDNS 解析服务

HttpDNS 的实现架构如下图：

在这里插入图片描述

用户的请求不再通过运营商来查询域名的解析，而是通过 HTTP 独立提供的一个方法来进行查询
这个 HTTP 接口后端再去向权威 DNS 请求，以及去做一个数据的同步。

保证传输链路安全：TLS传输层加密协议

对于消息在传输链路中的安全隐患，基本可以总结为以下几种：

中断：攻击者破坏或者切断网络，破坏服务可用性
截获：攻击者非法窃取传输的消息内容，属于被动工具
篡改：攻击者非常篡改传输的消息内容，破坏消息完整性和真实语义
伪造：攻击者伪造正常的通讯消息来模拟正常用户或者模拟IM服务端

解决方法

（1）关于消息链路中断，我们采用多通道方式进行解决

在即时消息系统中，对于“中断传输”这种主动攻击，破坏服务可用性的行为，一般可以采取多通道方式来提升链路可用性
比如很多IM系统的实现中，如果主链路连接不通或者连接不稳定，就会尝试自动切换到failover通道，这个failover通道可以是：
- 从HttpDNS服务返回的多个“接入IP”中选择性进行切换，防止某一个“接入IP”的中间链路被破坏
- 从当前数据传输协议切换到其他传输协议。比如从基于UDP协议的QUIC协议切换到基于TCP协议的私有协议；或者针对TCP的私有协议提供的HTTP Tunnel来对数据进行二次封装，防止某些针对特定协议的中断攻击

（2）关于消息传输过程被截获、篡改、伪造，我们可以利用私有协议和TLS的技术，来进行防控

私有协议：对于采用二进制私有协议的即时消息系统本身由于编码问题天然具备一定的防窃取和防篡改的能力里，相对于使用json、xml、html等明文传输系统，被第三方获取后在内容破解上相对成本更高，因此安全性更好一些。
TLS：
- 消息内容加密传输也能保证被截获之后无法获取到消息明文，同样也不能对加密的内容进行篡改，但问题的关键是加密密钥的协商本身需要较高的安全性保障
- 比如双方约定好一个固定秘钥来进行加密，但由于客户端代码被反编译等原因，可能导致秘钥泄露；或者双方在连接建立时再协商好一个临时秘钥，但这个临时秘钥在传输上本身就可能被截获，从而导致后续的密文都能被破解。
- 另外的问题是，如果有第三方伪装成服务端来和客户端交换秘钥，这样即使后续的传输内容都是加密的也没有办法防止消息的泄露问题。
- 因此，为了解决上面一系列的安全问题，业界一般采用 TLS 协议来对业务数据进行保护，TLS 巧妙地把“对称加密算法”“非对称加密算法”“秘钥交换算法”“消息认证码算法”“数字签名证书”“CA 认证”进行结合，有效地解决了消息传输过程中的截获、篡改、伪造问题。
  - 非对称加密算法和秘钥交换算法用于保证消息加密的密钥不被破解和泄露。
  - 对称加密算法对消息进行加密，保证业务数据传输过程被截获后无法破解，也无法篡改消息。
  - 数字签名和 CA 认证能验证证书持有者的公钥有效性，防止服务端身份的伪造。
- TTL本身相对于原本的TCP三次握手，需要更多算法确认、秘钥协商交换、证书校验等环节，因此在握手环节会多出1-2个RTT，所以TLS在连接效率和传输性能上有一定的额外开销
- 针对这个问题，最新的 TLS 1.3 版本进行了优化，可以支持 1-RTT 甚至 0-RTT 的握手环节，能较大幅度降低 TLS 的额外消耗，TLS 1.3 在 2018 年 8 月才定稿最终版本（RFC 8446），大规模铺开使用还需一定时间

如何确保消息存储安全性

由于消息漫游和离线消息等业务需要，大部分即使消息服务会将消息暂存在IM服务端端的数据库，并保留一定的时间，对于一些私密的消息和用户隐私数据，如果出现内部人员非法查询或者数据库被“拖库”，可能会导致隐私信息的泄露

账户密码存储安全：“单向散列”算法

针对账号密码的存储安全一般比较多的采用“高强度单向散列算法”（比如：SHA、MD5 算法）和每个账号独享的“盐”（这里的“盐”是一个很长的随机字符串）结合来对密码原文进行加密存储。

“单向散列”算法在非暴力破解下，很难从密文反推出密码明文，通过“加盐”进一步增加逆向破解的难度。当然，如果“密文”和“盐”都被黑客获取到，就不能完全保证密码的安全性。因此还需要综合从网络隔离、DB访问权限、存储分离等多方位综合防治。

消息内容存储安全：端到端加密

针对消息内容的存储安全，如果存储在服务端，不管消息内容的明文或者密文都存在泄露的风险。因此保证消息内容存储安全的最好方式是：

消息内容采用“端对端加密”（E2EE），中间任何链路环节都不对消息进行解密
消息内容不在服务端存储

采用“端对端加密”方式进行通信，除了收发双方外，其他任何中间环节都无法获取消息原文内容，即使是研发者也不能“破解”并获取数据，顶多停止这种加密方式。

业界很多聊天软件如 WhatsApp、Telegram 就采用了“端到端加密”方式来保证消息内容的安全。但国内的大部分即时消息软件如 QQ、微信等由于网络安全要求，目前暂时还没有采用“端到端加密”。

“端到端加密”之所以更加安全是因为：是由于和服务端 TLS 加密不一样，“端到端加密”的通信双方各自生成秘钥对并进行公钥的交换，私钥各自保存在本地不给到 IM 服务端。发送方的消息使用接收方的公钥来进行加密，因此即使是 IM 服务端拿到了加密信息，由于没有接收方的私钥，也无法解密消息。

消息内容安全性

内容安全性主要是指针对消息内容的识别和传播的控制，比如一些恶意的链接通过即时消息下发到直播间或者群，可能会导致点击的用户被引诱到一些钓鱼网站；另外一些反政、淫秽的图片、视频等消息的传播会引起不良的负面影响，需要进行识别处置并避免二次传播。

针对消息内容的安全性一般都依托于第三方的内容识别服务来进行”风险内容“的防范。

比如下面的几种方案：

建立敏感词库，针对文字内容进行安全识别。
依托图片识别技术来对色情图片和视频、广告图片、涉政图片等进行识别处置。
使用“语音转文字”和 OCR（图片文本识别）来辅助对图片和语音的进一步挖掘识别。
通过爬虫技术来对链接内容进行进一步分析，识别“风险外链”。

一般来说，针对内容安全的识别的方式和途径很多，也有很多成熟的第三方 SaaS 服务可以接入使用。

对于 IM 服务端来说，更多要做的是要建立和“识别”配套的各种惩罚处置机制，比如：识别到群里有个别人发色情视频或者图片，可以联动针对该用户进行“禁言处理”，如果一个群里出现多人发违规视频，可以针对该群“禁止发多媒体消息”或者进行“解散群”等操作。具体处置可以根据业务需要灵活处理。

小结

即时消息中，消息安全性是各种私密社交场景的核心需求，一般可以从三个维度来对安全性进行评价。

消息传输安全性。“访问入口安全”和“传输链路安全”是基于互联网的即时消息场景下的重要防范点。针对“访问入口安全”可以通过 HttpDNS 来解决路由器被恶意篡改和运营商的 LocalDNS 问题；而 TLS 传输层加密协议是保证消息传输过程中被截获、篡改、伪造的常用手段。
消息存储安全性。针对账号密码的存储安全可以通过“高强度单向散列算法”和“加盐”机制来提升加密密码可逆性；对于追求极致安全性的即时消息场景并且政策允许的情况下，服务端应该尽量不存储消息内容，并且采用“端到端加密”方式来提供更加安全的消息传输保护。
消息内容安全性。针对消息内容的安全识别可以依托“敏感词库”“图片识别”“OCR 和语音转文字”“外链爬虫抓取分析”等多种手段，并且配合“联动惩罚处置”来进行风险识别的后置闭环。