大数据供成屎
码龄3年
关注
提问 私信
  • 博客:19,302
    19,302
    总访问量
  • 24
    原创
  • 765,321
    排名
  • 3
    粉丝
  • 0
    铁粉

个人简介:需求太简单,做不了。。。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:香港
  • 加入CSDN时间: 2021-10-23
博客简介:

lbg20211023的博客

查看详细资料
个人成就
  • 获得12次点赞
  • 内容获得1次评论
  • 获得39次收藏
创作历程
  • 7篇
    2023年
  • 17篇
    2022年
成就勋章
兴趣领域 设置
  • Python
    python
  • Java
    java
  • 编程语言
    pythonjava
  • 开发工具
    idea
  • 大数据
    sqldatabasemysqlhbasehadoophiverediszookeepersparkflumeelasticsearchkafkabig dataflink数据库hdfsmapreduce大数据数据仓库
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hive中行转列,列转行的各种情况及解决方法

行转列:一般用case when,再做一个group by 去掉0值。如果应用多行 lateral view explode则做笛卡尔积。列转行:union all。
原创
发布博客 2023.08.03 ·
849 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

IDEA插件之GsonFormat

将JSON数据快速生成对应的实体类 1.插件下载好之后 ,先创建一个类2.在该类内按alt+s,会弹出一个会话框 3.将json数据放入之后点击ok 4.选择要保留的变量 5.结果
原创
发布博客 2023.05.03 ·
607 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Java对List集合sort排序

/ 先按照score的升序,然后按照height的升序。// 先按照score的升序,然后按照height的降序。// 先按照score的降序,然后按照height的降序。
原创
发布博客 2023.04.30 ·
363 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink sql批处理进行同Hive操作

Flink sql批处理进行同Hive操作
原创
发布博客 2023.04.29 ·
697 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

Flink流转表遇到的错误!

Data.execute().print();
原创
发布博客 2023.04.27 ·
157 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink精简笔记

Flink精简笔记基础版
原创
发布博客 2023.03.17 ·
175 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Spark中JOIN执行的5种策略

当要JOIN的表数据量比较大时,可以选择Shuffle Hash Join。这样可以将大表进行按照JOIN的key进行重分区,保证每个相同的JOIN key都发送到同一个分区中。Shuffle Hash Join的基本步骤主要有以下两点:首先,对于两张参与JOIN的表,分别按照join key进行重分区,该过程会涉及Shuffle,其目的是将相同join key的数据发送到同一个分区,方便分区内进行join。
原创
发布博客 2023.02.14 ·
761 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Spark内存溢出原因以及解决方式

Spark内存溢出原因以及解决方式。
原创
发布博客 2022.12.20 ·
1313 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pyspark精简笔记

pyspark精简笔记
原创
发布博客 2022.12.19 ·
142 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python精简笔记

python精简自学笔记
原创
发布博客 2022.12.05 ·
253 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

scala字符串trim,split,mkstring的一次错误记录

scala字符串切割合并的一次犯错记录
原创
发布博客 2022.11.10 ·
234 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink实例:状态管理State 过期时间TTL

一旦设置了 TTL,那么如果上次访问的时间戳 + TTL 超过了当前时间,则表明状态过期了(这是一个简化的说法,严谨的定义请参考org.apache.flink.runtime.state.ttl.TtlUtils类中关于 expired 的实现)。对于 RocksDB 的状态清理,则是通过 JNI 来调用 C++ 语言编写的 FlinkCompactionFilter 来实现,底层是通过 RocksDB 提供的后台 Compaction 操作来实现对失效状态过滤的。如果启用,则每次状态访问都将触发它。..
原创
发布博客 2022.08.29 ·
3366 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

HIve汇总

hive
原创
发布博客 2022.08.29 ·
553 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

精选Flink面试题

精选Flink面试题
原创
发布博客 2022.08.23 ·
806 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Flink CEP 匹配后跳过策略

flink匹配后跳过策略
原创
发布博客 2022.08.10 ·
381 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

hive复杂类型数据详解—array,map,struct

hive复杂类型数据详解—array,map,struct
原创
发布博客 2022.07.28 ·
1734 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

Spark中map、mappartition、foreach 以及 foreachpartition的区别和对比

foreach用于遍历集合,而map用于映射(转换)集合到另一个集合。
原创
发布博客 2022.07.25 ·
2089 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

kafka 偏移量latest、earliest

按照栗子来说就是之前订过1月份的报纸(存在offset记录)然后设置earliest此时是不管用的,报社还是会给你发1月之后的报纸(不会从头消费),而如果你是一个新用户(不存在offset)当你订阅报纸并设置earliest此时报社才会从头开始发送所有的报纸。按照栗子来说就是之前订过1月份的报纸(存在offset记录)然后设置latest,报社会给你发1月之后的报纸,而如果你是一个新用户(不存在offset)当你订阅报纸并设置latest此时报社会发送最新的报纸。......
原创
发布博客 2022.07.21 ·
948 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

kakfa中key的介绍

如果数据输入时指定了key,那么分区时可能会和key有关,并且key中的值就是给定的数据,一般是元数据,或者你需要的数据放在其中方便后续使用。如果没有指定分区和key,分区规则就是粘性分区,此时存储的key中是没有任何值的,即为空,也就没有任何作用,只是为固定的kv对做了搭配而已。...
原创
发布博客 2022.07.16 ·
152 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ES面试题总结

elasticsearch es 的集群架构,索引数据大小,分片有多少,以及一些调优手段 。
原创
发布博客 2022.07.14 ·
574 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多