自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 数仓开发那些事_番外

数仓开发那些事_番外FLINK SQL遇到的问题

2024-06-17 10:39:52 403 2

原创 SQL新老系统表数据合并

面对新老系统表数据合并问题时的处理方式

2023-03-14 17:48:05 533 1

原创 Java实现阴历日历表(附带星座)

JAVA生成阴历,附带星座字段

2023-02-24 16:46:29 999

原创 数仓开发那些事(6)

实时数仓框架选型

2021-12-17 11:51:10 78

原创 数仓开发那些事(5)

数仓开发那些事(5)

2021-12-13 18:53:11 1582 1

原创 数仓开发那些事(4)

实时中遇到的那些事(Spark.Flink)

2021-12-11 16:25:58 1660 1

原创 数仓开发遇到的那些事(3)

数仓开发那些事(3)

2021-12-10 15:37:08 2151 3

原创 数仓开发遇到的那些事(2)

数仓开发遇到的那些事(2)

2021-12-09 12:57:32 721 3

原创 数仓开发遇到的那些事(1)

大数据数仓开发遇到的那些事

2021-12-08 12:49:44 844 1

原创 Flink实时数仓订单宽表设计思路及优化

Flink数仓建设有感

2021-12-05 00:22:31 1196 2

原创 Flink多并行度下WaterMark的设计区别

watermark在多并行度情况下的设置

2021-12-01 23:06:57 2040

原创 JDBC工具类(适用于Mysql.Hive.Phoenix等)

JDBC工具类,通用性强,内含命名格式转换方法

2021-11-28 17:17:29 1915 1

原创 Flink 事件时间EventTime及水印WaterMark

WaterMark的概念.书写.原理.场景

2021-11-21 20:55:04 2108 2

原创 Redis缓存穿透、缓存击穿、缓存雪崩问题

Redis缓存穿透、缓存击穿、缓存雪崩问题概念与简单处理

2021-11-18 15:25:45 730 3

原创 Flink Table API 与 Flink SQL 实现Kafka To Kafka 版本1.12

Flink Table API实现Kafka2Kafka按需可以成为实时数仓的组成部分

2021-11-18 10:57:37 2683 3

原创 Flink-Barrier理解与checkpoint检查点制作过程(图解)

理解Barrier面向官网,发现看不懂,那咱就画图

2021-11-16 08:22:30 6535 7

原创 IDEA控制台输出中文乱码解决 版本:2021.1

在网上踩了不少的坑,重启了IDEA三四次,现在写个完整版1.依次点击2.依次点击,把图中③④⑤处全部修改为UTF-83.依次点击①②,在里面都加上一行-Dfile.encoding=UTF-84.

2021-11-12 18:35:32 14692 8

原创 MapReduce全过程参数优化

最近花了点时间整理了一下,涵盖了全流程常见实用的调优参数.希望能有帮助1)Map阶段(1) 增大环形缓冲区大小(默认100M,可以提高到200M)mapreduce.take.io.sort.mb(2)增大环形缓冲区溢写的比例(默认80%,可以提高到90%)mapreduce.map.sort.spill.percent(3)减少对溢写文件的merge次数(默认10个文件,可以增大到20)mapreduce.task.io.sort.factor(4)不影响实际业务

2021-11-04 19:45:39 494

原创 Hbase工具类 V2.0.5

提供了1.创建链接2.创建命名空间3.判断表存在与否4.创建表5.修改表6.删除表7.插入数据8.查询数据9.扫描数据10.删除数据Maven添加如下依赖<dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifactId>h...

2021-10-29 20:16:40 1195 1

原创 电商离线数仓全流程思路整理

电商离线数仓设计思路加油加油私我可以要PDF或者Visio版 哪里不好的欢迎指正蛤!!!...

2021-10-22 19:31:11 86 1

原创 业务数据采集_零点漂移处理方法(Flume+Kafka+HDFS)

零点漂移

2021-10-02 07:53:44 3504 2

原创 python中使用正则表达式去除制表符\t,换行符\n

在网上踩了很多的雷,发现并没有能解决问题的办法首先 'r’一定不能忘,很多情况下都是没加r导致没有效果re.split()在PyCharm中这里就用字符串a为例:a='\\t\\n\\t\\t\\n\\n\\t'print(a)# output: \t\n\t\t\n\n\t如果需要清除多个字符,在参数内用’|'分割最后使用join进行连接,可以完美的清除制表符和换行符a='\\t\\n清除成功\\t\\t\\n\\n\\t'import rea1=re.split(r'\\t|\

2021-05-18 11:35:07 10386 1

原创 PYTHON实战:从百度资讯爬取信息作为正文,巨潮资讯网爬取有关PDF作为附件,自动发送邮件(Mysql做存储)

小小的前言:鄙人在学习过程中写的小实践.效率不高.大佬勿喷.其中的强制等待严重影响运行速度.建议使用隐式或者显示等待用Pyqt5画了个简单的GUI(xwin.ui)然后通过pyuic -o xwin.py xwin.ui 就可以转为py文件了然后通过按钮触发druging函数.因为我不会使用按钮传参数.所以def了一个中介函数哈哈哈哈哈哈.勿喷.看到代码就懂了其中try except异常处理是我对很多情况进行尝试后得出的设计.因为百度和巨潮对我这个实战不是特别友好.哈哈哈哈哈哈哈.下次设

2021-04-19 14:56:40 1599 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除