HdxPyt
码龄6年
关注
提问 私信
  • 博客:1,981
    动态:49
    2,030
    总访问量
  • 3
    原创
  • 912,448
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2018-09-03
博客简介:

weixin_43118938的博客

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得9次收藏
创作历程
  • 3篇
    2021年
成就勋章
TA的专栏
  • Airflow
    1篇
  • 自定义宏
    1篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive-udf开发流程

第一步:拉取git项目地址:https://git.100tal.com/peiyou_bigdata/hive-udf.gitjava文件放置路径:hive-udf/src/main/java/com/bigdata/udf第二步1、编写udf代码(string转long型)package com.bigdata.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class MD5ToLong extends UDF{ publ
原创
发布博客 2021.10.22 ·
793 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

2021-10-09

一、Airflow自定义宏函数# 不同批次需限定分区# 根据DAG下一个批次的逻辑执行时间计算出当前批次的东八区时间来确定分区# ---- 定义小时级任务处理时区的函数,用于宏处理 ----------import datetimefrom datetime import datetimefrom datetime import timedeltadef partitions(next_exec_date, hours=7): """ 自定义 Jinja 方法,根据批次时间
原创
发布博客 2021.10.09 ·
400 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Kafka高效读写

Kafka高效读写1、页缓存技术 + 磁盘顺序写2、零拷贝技术3、最后的总结“这篇文章来聊一下Kafka的一些架构设计原理,这也是互联网公司面试时非常高频的技术考点。Kafka是高吞吐低延迟的高并发、高性能的消息中间件,在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。那么Kafka到底是如何做到这么高的吞吐量和性能的呢?这篇文章我们来一点一点说一下。1、页缓存技术 + 磁盘顺序写首先Kafka每次接收到数据都会往磁盘上去写,如下图所示。
原创
发布博客 2021.10.08 ·
790 阅读 ·
1 点赞 ·
0 评论 ·
10 收藏