select小菜鸡
码龄3年
关注
提问 私信
  • 博客:14,411
    14,411
    总访问量
  • 1
    原创
  • 383,354
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2022-05-17
博客简介:

m0_71049680的博客

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得1次评论
  • 获得24次收藏
创作历程
  • 2篇
    2022年
成就勋章
TA的专栏
  • presto
    1篇
  • Doris
    1篇
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

344人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

列转行cross join unnest用法注意点

列转行cross join unnest用法注意点
原创
发布博客 2022.10.19 ·
5864 阅读 ·
1 点赞 ·
1 评论 ·
4 收藏

弄清Doris/StarRocks分区partition by和分桶distributed by的区别,以及如何选择对应的字段

选择分区键选择合理的分区键可以有效的裁剪扫描的数据量。目前仅支持分区键的数据类型为日期和整数类型。在实际业务场景中,一般从数据管理的角度选择分区键,常见的分区键为时间或者区域。按照分区键划分数据后,单个分区原始数据量建议不要超过 100 GB。选择分桶键选择高基数的列(例如唯一 ID)来作为分桶键,可以保证数据在各个分桶中尽可能均衡。如果数据倾斜情况严重,您可以使用多个列作为数据的分桶键,但是不建议超过 3 个列。...
转载
发布博客 2022.08.11 ·
8546 阅读 ·
2 点赞 ·
0 评论 ·
19 收藏