数据处理
文章平均质量分 88
那一年天空很高风很清澈
这个作者很懒,什么都没留下…
展开
-
Greenplum 扩容
Greenplum扩容节点步骤概述greenplum扩容segment可以分为2类:单机上的seg增加,我们称之为“纵向扩展” 单机不变,通过增加机器,我们称之为“横向扩展”下面详细介绍下这两种扩容方式的具体步骤和方法gpexpand命令首先我们来学习一下 gpexpand 命令,基本使用方法如下:gpexpand [-f <hosts_file>]| -i <input_file> [-B <batch_size&g...原创 2022-05-11 16:48:27 · 858 阅读 · 0 评论 -
同环比设计一二三
思路一:表自连接这种方案能搜到很多类似的回答,点击这个链接。这种方案可以用户一般的业务系统,但是数据量一旦提升还是有一定的查询压力的。这里不多阐述。思路二:采用窗口函数oracle有lag和lead窗口函数,配合over(partition by order by)使用。示例文章点击这里。这里大家都会碰到一个问题就是,时间节点补全的问题。由于数据原因,数据不是每天连续的数据,就会导...原创 2019-01-29 15:46:05 · 392 阅读 · 0 评论 -
neo4j etl工具导入中文数据出现乱码解决方案
我在使用neo4j etl工具导入数据时,中文出现乱码。是因为etl生成的csv保存的编码格式为ansi格式,我们用记事本打开,修改编码为UTF8。然后在neo4j的安装目录的import文件夹下面找到对应的load-csv.cypher文件,执行里面的cypher语句重新导入即可。其实出现乱码的原因是所用系统的默认编码的原因,调整系统默认编码可以解决。...原创 2019-05-08 18:24:38 · 3609 阅读 · 1 评论