Raise~
码龄5年
关注
提问 私信
  • 博客:14,553
    14,553
    总访问量
  • 9
    原创
  • 1,917,898
    排名
  • 2
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2019-12-17
博客简介:

argue10的博客

查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得3次评论
  • 获得15次收藏
创作历程
  • 1篇
    2023年
  • 3篇
    2022年
  • 5篇
    2021年
成就勋章
TA的专栏
  • hive
    1篇
  • 数据库
    2篇
  • flink cdc
    2篇
  • kafka
    1篇
兴趣领域 设置
  • Python
    virtualenvtornado
  • 数据结构与算法
    排序算法
  • 大数据
    hadoophivestormsparketl
  • 后端
    djangoflask
  • 嵌入式
    单片机嵌入式硬件
  • 硬件开发
    硬件工程驱动开发材料工程精益工程硬件架构
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hive分桶操作,按照分桶的id去指定查询。

hive分桶找到具体数据
原创
发布博客 2023.08.25 ·
298 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

UNION ALL 不能生成、插入数据至hive

UNION ALL 不能生成、插入数据至hive
原创
发布博客 2022.07.28 ·
1246 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏

Hive的in与not in 值中有null的时候注意事项,join where条件等问题

在进行hive SQL查询数据的时候,where条件中使用了in或者not in,但是该值内有null空。这时,无论是in还是not in,空值都不会进入该条件内,但是使用not in的时候只是希望把自己不想要的数据给排除掉,这时会同步把为null的数据也进行排除掉了。所以,在写not in或者in的时候,如果希望保留为null的数据。最好加一条where (col not in (1,2,3,4) or col is null)同样,进行先join 后where操作的时候,同样要注意值为n
原创
发布博客 2022.04.20 ·
3653 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

Sqoop从MySQL导数据至hive数据表异常(数据量不对,数据值不对)

通过数据比对,发现sqoop导入hive的数据与MySQL原始数据对应不上,表现为两点:①查数据总数不对,MySQL的count(1) = 108120条数据,但是导入至hive发现只有108112条数据,数据发生了丢失。②应查数据值不对,查询到某个字段,MySQL值中仅有1,2两种值,但是hive表中包含1,2,以及一串看不懂的数字。经反复核对数据,发现问题症结,所以就将它记录下来了。...
原创
发布博客 2022.04.19 ·
4016 阅读 ·
4 点赞 ·
1 评论 ·
8 收藏

Flink侧输出流执行报错,org.apache.flink.api.common.functions.InvalidTypesException

Flink侧输出流执行报错,org.apache.flink.api.common.functions.InvalidTypesException
原创
发布博客 2021.11.25 ·
2574 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

azkaban直接写脚本运行,不写flow文件

Azkaban直接调度 编辑两个文件 .job文件 type=commandcommand=sh ./a.sh .sh脚本文件 具体的脚本 指定在具体某一台机器上执行
原创
发布博客 2021.07.07 ·
233 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

hive 自定义UDF函数

自定义UDF函数0)需求:自定义一个UDF实现计算给定基本数据类型的长度,例如:hive(default)> select my_len("abcd");41)创建一个Maven工程Hive2)导入依赖<dependencies><dependency><groupId>org.apache.hive</groupId><artifactId>hive-exec</artifactId>
原创
发布博客 2021.05.17 ·
711 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink cdc 解析op

ali利用flink在进行CDC监控mysql的时候,默认的序列化的return对象的字符串,通常需要自定义反序列化器,其中获取op类型可以使用://获取操作类型Envelope.Operation op = Envelope.operationFor(record);
原创
发布博客 2021.04.24 ·
1599 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

kafka自定义组件:自定义生产者(含自定义分区),自定义消费者,自定义拦截器

自定义组件:自定义生产者(含自定义分区),自定义消费者,自定义拦截器自定义生产者:官网地址:https://kafka.apache.org/26/javadoc/index.html?org/apache/kafka/clients/producer/KafkaProducer.html * 1. 创建生产者配置对象 * 2. 添加配置信息 * 3. 创建生产者对象 * 4. 调用send发送消息 * 5. 关闭资源 * 6. 创建静态内部类,返回当前类对象 //代码: ..
原创
发布博客 2021.04.22 ·
225 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏