压缩冗余信息

最新推荐文章于 2023-03-11 21:44:57 发布

dog250

最新推荐文章于 2023-03-11 21:44:57 发布

阅读量9.5k

点赞数 1

文章标签：压缩

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dog250/article/details/126187304

版权

我们传输的大量信息都是少量信息的简单组合(yet another 幂律?)。

任何信息均如此。对于文字信息，有固定的短语，俚语，名言警句，对于多媒体，有范式化前奏，BGM，名人舞姿，常见镜头，体现在数据包中就是一些 0，1 组合成的固定比特片段。

把这些片段甄别出来，为其关联唯一短 ID，部署在内容的中间转发节点上，事情将变得高尚。
在这里插入图片描述
转发数据包时，用数据包的任意子串匹配这些片段(诸如 Leetcode “求最长子串”，练熟了还是有用的。)，一旦命中，即可将较长子串替换成较短 ID，相当于仅传输字典索引，时间换空间，大大降低传输量，从而节省带宽。

图中那张“共享的 ‘内容 -> ID’ 映射表”可通过离线/在线学习获得，也可人工配置。

说起在线学习，可以维护一个 LRU 链表，保存最 Hot 的 Top N 片段。

最后说优化，还是那句话，所有优化都需要注入新信息，优化匹配算法的信息来自现实世界。

打个比方，紧接着“当我避开你的温柔后”的大概率是“泪开始坠落”。或者可为每个区域，甚至每个用户维护一个字典，现实世界具有相同特征的 entry 传输的数据重复度也偏高。比如说涉及浙江温州的数据传输，专门建立一个皮鞋相关的字典，是高尚的。

这种传输优化可用于朴素的 CDN 动态加速，也可用于朴素的 CDN 静态加速回源，但注意，一定要朴素，不然得不偿失，但最能打的场景还是隧道传输加速了。

前两周我提到过，统计复用率足够高时，端到端传输优化很难闭环，单流结果不再由单流行为决定，大多数端到端算法被认为不靠谱，不如降低发送量，从而提高通过率，最大程度减少重传时延。进一步说，如果大家都这么做，世界又将重新变得高尚。

传统 TCP/IP 网络早被 CDN 盖了一个内容层，鉴于此，本文说的这类朴素的内容层，从不识别内容，只识别“一段具有特征的比特流”，将其编码成更短的比特流，就算赚到，细节可能还包括高效的匹配算法和编码方案。

至于古时候存储介质(竹简，石头)和传输介质(马车)都很贵的时候，书面语总比口语惜字如金，也是这个意思。白话文被写下来的行为在宋朝之后普及，因为宋朝之后大范围普及了纸，或者还有稍许活字印刷术。

超过 20 ms 的传输在平时上网中就很少见，绝大多数内容都是通过 CDN 接入，而 CDN 调度机制基本上不会调度到太远的地方，因此果真要做长传，一定要控制丢包率，如果丢包率不能控制，就选择抗丢包的算法，比如 BBR。降低丢包还有一个方法将是少发数据，发得少丢得少。就是本文。

浙江温州皮鞋湿，下雨进水不会胖。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

dog250

CSDN认证博客专家 CSDN认证企业博客

码龄17年

2170: 原创

2444: 周排名

9: 总排名

2506万+: 访问

: 等级

17万+: 积分

2万+: 粉丝

1万+: 获赞

5541: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

为什么在VMWare的NAT模式下无法使用traceroute
沈弘亮新宇的: 2024年下半年我觉得我买的那个不到三十一个月的国内挂机宝可能就是用这种方式虚拟nat的网络，中间全部是星号，感谢大佬记录技术原因
从tcpdump看cBPF/eBPF程序设计
kongu106: 一台机器部署了两个Redis，分别是A和B，基于libpcap实现一个抓包程序，过滤规则是：tcp and dst port A端口 and dst host AIp，但是发现在B节点上收到发送给A节点的数据，机器和网卡都分析过，无问题；怀疑可能是抓包引起的，楼主遇到过类似问题或指点一下思路
Linux实现的IEEE 802.1Q VLAN
renjie0310: 没看懂最后那个图，脱掉tag后（vlan10）为啥直接去了ETH0.Y（vlan y），这是怎么操作的。没有理解。
走进四维空间-我们如何理解时空
随意~无所谓: 如果时间是第四维，那么代表四维生物能掌控时间。但，在人类的设定中，四维生物能够掌控时间吗？对于二维生物来说，他们在二维世界里面随意行走，三维生物清楚观察到他们。二维生物可以往左走，往右走。但四维生物观察三维却是不可逆转的时间。也就是所谓的可逆性。
夜谈弱网场景的TCP
Ha_Ha_Wu: 大佬写的有点难懂

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。