- 博客(9)
- 资源 (3)
- 收藏
- 关注
原创 【clickhouse】
采用列式存储扫描范围小,只需要扫描这一列的数据压缩率高,同一数据类型下,压缩效率好。磁盘io,数据传输小 默认使用 LZ4压缩。总体可以达到8:1的压缩效果。向量化执行引擎向量化执行简单理解就是消除程序中循环的优化。每列的数据存储在一起,可以认为这些数据是以数组的方式存储的,基于这样的特征,当该列数据需要进行某一同样操作,可以使用SIMD进一步提升计算效率,即便运算的机器上不支持SIMD, 也可以通过一个循环来高效完成对这个数据块各个值的计算。
2024-05-13 10:17:00 595
原创 布隆过滤
布隆过滤布隆过滤什么是布隆过滤误判率实现什么是布隆过滤回答这个问题之前,先回答布隆过滤能干什么?布隆过滤主要被用于判断一个元素是否是否属于某个数据集,通常这个数据集比较大,不能放入内存中。但是布隆过滤会存在误判,就是 把某个不属于这个数据集的元素 误判为 这个数据集的元素 , 但是 如果某个元素 属于这个数据集 布隆过滤判断这个元素是否属于这个数据集 不会...
2018-06-15 21:15:30 341 2
原创 install mysql on Linux CentOs
install mysqlinstall mysql下载mysql压缩包创建mysql用户 并解压mysql压缩包下载mysql压缩包mysql-5.6.38-linux-glibc2.12-x86_64.tar.gz创建mysql用户 并解压mysql压缩包groupadd mysqluseradd -g mysql -m mysql passwd mysql -
2017-10-22 09:30:35 741
原创 hadoop集群搭建
hadoop集群搭建hadoop集群搭建前期准备hadoop namenode 配置core-sitexmlhdfs-sitexmlmapred-sitexmlyarn-sitexmlslaves格式化NAMENODE启动hadoop集群前期准备### 虚拟机三台 主机名 ip 功用 hadoop-server01 192.168.3.101 namenode
2017-07-18 01:28:38 354
原创 hadoop
conf.set("mapred.textoutputformat.ignoreseparator", "true");conf.set("mapred.textoutputformat.separator", "|");
2017-03-22 17:44:20 232
PyQt4-4.11.4-gpl-Py2.7-Qt4.8.7-x64.exe
2018-08-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人