![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
tech
weixin_40147959
这个作者很懒,什么都没留下…
展开
-
slimarray: gzip的压缩率, 即时访问
12 分钟阅读 本文链接: https://blog.openacid.com/algo/slimarray/ slimarray 场景和问题 在时序数据库, 或列存储为基础的系统中, 很常见的形式就是存储一个整数数组, 例如 slim 这个项目按天统计的 star 数: 这类数据有有很明显的统一的变化趋势, 对这类数据的存储, 我们可以利用数据分布的特点, 将整体数据的大小压缩到几分之一. 这就是 slimarray 要做的事情. 使用 slimarray, 可以将数据容量减小到gzip差不多的大小原创 2020-11-18 16:01:30 · 162 阅读 · 0 评论 -
200行代码实现基于paxos的kv存储
本文链接: https://blog.openacid.com/algo/paxoskv/ 前言 写完 paxos的直观解释 之后, 网友都说疗效甚好, 但是也会对这篇教程中一些环节提出疑问(有疑问说明真的看懂了 ???? ) , 例如怎么把只能确定一个值的paxos应用到实际场景中. 既然Talk is cheap, 那么就Show me the code, 这次我们把教程中描述的内容直接用代码实现出来, 希望能覆盖到教程中的涉及的每个细节. 帮助大家理解paxos的运行机制. 这是一个基于paxos,原创 2020-11-08 21:19:12 · 193 阅读 · 3 评论 -
Art of Pull Requests(翻译)
本文链接: https://blog.openacid.com/culture/pr/ 原文: Art of Pull Requests 正如我之前写的, 我们是一个远程团队,团队成员遍布世界各地。 这意味着code reviews 和 pull requests必须远程完成。 最近,我们团队的一位成员提出了这样的宣言: 作为 PR writer 我会: 保持PR够小 使用标签表明PR是许多部分之一 发布PR后在Slack上也提一下 作为 PR reviewer 我会: 一有空就review。翻译 2020-10-28 15:50:00 · 78 阅读 · 0 评论 -
互联网中对象访问频率的91分布
在互联网领域, 流行着这么一句话: 90%的流量由10%的内容产生. 缓存也由此产生: 只为最频繁访问的10%的内容提供更快的存储, 就可以以很低的成本提供尽可能好的服务质量. 一般符合这种互联网访问模型的曲线是下图这样的. 对每个访问的url做独立计数, 并按照从访问最多到最低排序: 这句是一个经验结论, 从它可以得出我们的频度分布公式: 也就是zipf 模型. f(k)=c/ks f(k...原创 2019-12-02 22:10:14 · 221 阅读 · 0 评论