大数据
文章平均质量分 89
大棒槌QAQ
这个作者很懒,什么都没留下…
展开
-
YDB中的spark广播变量
YDB中的spark广播变量《《《《《《《 大棒槌QAQ 》》》》》》》何为YDB?YDB全称延云YDB,是一个基于Hadoop分布式架构下的实时的、多维的、交互式的查询、统计、分析引擎,具有万亿数据规模下的秒级性能表现,并具备企业级的稳定可靠表现。YDB是一个细粒度的索引,精确粒度的索引。数据即时导入,索引即时生成,通过索引高效定位到相关数据。YDB与Spark深原创 2018-02-03 16:15:17 · 427 阅读 · 1 评论 -
YDB跨集群导入数据
YDB跨集群导入数据《《《《《《《 大棒槌QAQ 》》》》》》》在YDB中这跨集群导入数据,在装有YDB的A集群中可以将B集群中HDFS的数据导入到A集群的YDB表中。相关的配置如下。1.若ydb集群对端hadoop集群(集群②)的NN没有高可用在YDB集群(集群②)执行跨集群导入数据。执行以下样例命令即可sh /opt/ydbsoftware/ya100/bin/yd...原创 2018-03-05 08:41:38 · 402 阅读 · 0 评论 -
YDB中多值列讲解
《《《《《《《 大棒槌QAQ 》》》》》》》- YDB多值列介绍在一个列里可以存储多个值。比如,可以将一个人 的多个标签值 存储在一个记录里面,一个人的每天的行为数据 放在一个记录里面。- 适用场景有一个表存储学生的一些特征数据例如,姓名、年龄、体重、身高等。 如下图所示 - 多值列类型多值列所有数据类型均为按列存储- 多值列支持的数据格式①支持以空格分割的...原创 2018-04-07 22:37:39 · 789 阅读 · 0 评论