想象造物-CSDN博客

从零开始学习SDN，整个过程异常艰难。为此愿意降低大家学习SDN的难度，本系列的目标是，即使一个非计算机专业的人，只要有一定的编程能力，也能在学习了系列后，能够上手SDN相关的应用与实战。主要利用仿真技术来学习，以降低学习成本。我们将使用第一性原理的思路，来开始这段历程。我们将使用第一性原理的思路，来开始这段旅程。首先第一个问题就是，网络的本质是什么？

2024-08-11 23:19:14 1448

原创使用图形化工具分析clickhouse数据之tableau-从安装到技巧

使用tableau分析clickhouse里的数据。从安装到一些简单使用技巧。

2024-08-10 19:18:12 1538

原创使用celery做异步的clickhouse表导出--带去重和任务数控制

使用celery做异步的clickhouse表导出，带任务去重和任务数控制，提供外部访问API。

2024-08-09 07:00:00 1169 1

原创如何高效处理亿级海量数据-Clickhouse速通（下）

但在少数情况下，如果你要查询的结果不幸分布在了两个不同的part里，那么合并就不会很彻底，也就是相同的主键会出现两个，结果就会出现两条了。其中：sumMap([method], [1]) AS method_Map 这部分的意思是给每个值都设置一个计数值，出现就记为1，sumMap会自动归并相同的key，同一个key对应value累加。一般要使用sumMerge/sumMapMerge 这样的xxxMerge函数来合并统计结果，相应的统计也要使用xxxState的函数进行统计。物化视图是可以逐层叠加的。

2024-08-08 18:30:00 2813

原创如何高效处理亿级海量数据-Clickhouse速通（上）

其实原因也很简单，Clickhouse的创始公司，Yandex，是俄罗斯最大的搜索引擎，其处理的数据也必然都是互联网的数据，我们面对的数据本质上是相同的。这里展示了存储了一天的数据量。SETTINGS index_granularity = 16384 这个是参考了Cloudflare的方案，因为日志量大集中，用较大的粒度可以更好的利用存储和提高压缩比，计算也更快。带来的第一个特性就是压缩特性，因为同一列的数据通常是相似的，因此相比行它们具有更高的压缩比，所以列数据库可以很方便的利用压缩减少存储占用。

2024-08-07 07:00:00 2885

simulate_create的博客

原创如何在任何情况下都能找到方法？解决问题方法论 —— 一升一降

原创 PostgreSQL DETAIL: Key (id)=(423) already exists. 问题解决

原创 golang-gin使用中间件处理文本-时间字符串格式

原创复制与引用

原创模拟两台计算机的通讯-启动虚拟机（brctl+qemu组网）

原创模拟两台计算机的通讯-GNS3仿真

原创 Clickhouse x PostgreSQL --从PG中读取数据作为字典进行查询

原创 clickhouse常用查询汇总（持续更新）

原创如何记录技术日志？笔记结构两则：猜想与验证、知行合一

原创利用clickhouse的URL引擎做数据推送

原创模拟两台计算机的通讯-netns和brctl组建网络

原创网络是什么-利用代码模拟理解网络的本质

原创使用图形化工具分析clickhouse数据之tableau-从安装到技巧

原创使用celery做异步的clickhouse表导出--带去重和任务数控制

原创如何高效处理亿级海量数据-Clickhouse速通（下）

原创如何高效处理亿级海量数据-Clickhouse速通（上）

celery-unique.py

空空如也