自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

java技术分享

主要平常自己学习源码心得分享以及在日常开发中遇到的解决bug的经验分享

  • 博客(60)
  • 资源 (4)
  • 收藏
  • 关注

原创 (mysql和pg) -> flink-cdc -> kafka -> flink-sql -> StarRocks

【代码】(mysql和pg) -> flink-cdc -> kafka -> flink-sql -> StarRocks。

2023-11-22 15:58:08 162

原创 MongoDB复杂聚合查询与java中MongoTemplate的api对应

MongoTemplate的API。MongoDB聚合json脚本。

2023-09-08 14:04:50 624

原创 使用lambda表达式提取共用代码使其更加简洁

使用lambda表达式提取共用代码使其更加简洁

2023-08-23 16:40:39 183

原创 redisson实现可靠高效的延迟队列

redisson实现可靠高效的延迟消息

2023-08-17 14:28:38 777 4

原创 使用redisson客户端java位移运算实现多条件排名

3.1、由于时间戳按照正序排序所以先提交的要拍前面,说明分数要大一些。1、使用条件说明,由于一个分区有大概1万学生按照答题分数进行实时排名。附加题分数最大支持 1111111 = 2 + 4 + 8 + 16 + 32 + 64 + 128。3.2、附加题由于数量有限制分数最大不操过50分,给其分配7位。第三步、如果附加题的分数还相等则按照提交答案的时间戳正序排序。第二步、如果分数相等按照附加题的分数排序。分数 + 附加题分数 + 时间戳。第一步、按照分数排序。

2023-07-06 18:26:49 241

原创 记一次cloudera删除/var/lib/cloudera-host-monitor/ts/stream/日志导致无法重启问题

1、报错信息如下:日志目录/var/log/cloudera-scm-firehose/mgmt-cmf-mgmt-HOSTMONITOR-hadoop102.log.out。很明显就是因为删除的日志导致找不到文件。

2023-06-25 13:53:08 307

原创 扩展dlink-connector-phoenix使其phoenix-5.0.0支持flink1.16

目前我使用的是CDH6.3.2,flink使用的是1.6,Phoenix版本的是5.0.0这有在我的博客中提到过,hbase使用的是自带的2.x。这就遇到问题了目前有支持的比较好的是dlinky这个里面的插件,我现在需要做的是将dlink-connector-phoenix这个插件编译打包上传到flink的lib目录中使用sql-client进行测试。3、将dlink-connectors中的dlink-connector-phoenix-1.14拷贝一份到同级目录下面。mvn的仓库配置的是。

2023-06-01 17:50:32 904

原创 编译flink1.6源码并打包成CDH6.3.2的parcel并且部署CDH6.3.2

10、将打包好的flink-1.16-SNAPSHOT-bin-scala_2.12.tgz放到flink-parcel目录下。14、FLINK-1.16-SNAPSHOT-BIN-SCALA_2.12_build文件夹中包含的文件。包名:flink-1.16-SNAPSHOT-bin-scala_2.12.tgz。7、打包parcel,建议在阿里云服务器上打包很快。9、修改flink-parcel.properties。3、修改flink目录下的pom.xml文件。4、修改setting.xml文件。

2023-05-22 18:08:50 1051 1

原创 【自定义debezium插件支持按照表名hash路由到同一个主题不同分区中】

自定义debezium插件支持按照表名hash路由到同一个主题不同分区中

2023-04-10 11:07:51 464

原创 CDH6.3.2引入debezium-connector-mysql-1.9.7监听mysql事件

首先说明一下为啥选用debezium,它能够根据事务的提交顺序向外推送数据,这一点非常重要。再有一个结合kafka集群能够保证高可用,对于熟悉java语言的朋友后面一篇博文会介绍怎样编写插件将事件自定义路由到你想要的主题甚至分区中。提高按顺序消费事件的并发能力。如果觉得好,请关注一下,后续将推出编写插件支持按照表名hash取模将事件分配到不同的主题或者分区当中支持多线程顺序并发消费,实现表与表之间的数据一致性

2023-04-10 10:22:00 496

原创 spark3.3.1通过hbase-connectors连接CDH6.3.2自带hbase

spark3.3.1通过hbase-connectors连接CDH6.3.2自带hbasehbase-connectors源码编译scala脚本测试hbase-connectorspyspark脚本测试hbase-connectors

2023-01-15 15:58:23 749

原创 CDH6.3.2版本pyspark-sql通过hive访问hbase

CDH6.3.2版本pyspark-sql通过hive访问hbase

2023-01-09 17:27:38 315

原创 streamsets3.22服务器CDH版本安装

streamsets3.22.3服务器CDH版本安装

2022-12-30 15:36:23 645 6

原创 pyspark结合hive使用 spark on hive方式开发代码附上代码实例

pyspark结合hive使用 spark on hive方式开发代码附上代码实例

2022-12-16 17:30:02 510

原创 vscode jupyter配置远程服务器开发

vscode jupyter配置远程服务器开发

2022-12-16 16:53:37 1402

原创 conda打包pyspark运行环境在yarn上运行

conda打包pyspark运行环境在yarn上运行

2022-12-14 17:49:06 446

原创 打包CDH6.3.2版本的pyspark到conda中进行日常开发

打包CDH6.3.2版本的pyspark到conda中进行日常开发

2022-12-11 18:39:29 193

原创 python3.7.6版本支持spark3.3.1的pyspark

python3.6.5版本支持spark3.3.1的pyspark

2022-12-10 19:55:36 1451 1

原创 服务器编译spark3.3.1源码支持CDH6.3.2

服务器编译spark3.3.1源码支持CDH6.3.2

2022-12-10 14:01:45 1574 5

原创 记录一次被植入木马处理

记录一次被植入木马处理

2022-12-09 11:16:29 763 2

原创 CDH-6.3.2完整安装附带资源包

CDH-6.3.2完整安装附带资源包

2022-12-07 19:34:39 1431

原创 vscode中jupyter插件使用conda环境引入pyspark

vscode中jupyter插件使用conda环境引入pyspark

2022-11-28 00:08:12 962

原创 mac conda3安装pyspark以及注意问题

mac conda3安装pyspark以及注意问题

2022-11-27 17:56:07 1022

原创 pandas学习

pandas学习

2022-11-25 16:18:11 187

原创 python分析 【都挺好】小说任务关系

python分析 【都挺好】小说任务关系

2022-11-18 14:51:48 306

原创 解决matplotlib中文显示异常问题

mac matplotlib中文显示异常

2022-11-18 11:48:46 230

原创 巧用微服务进行大数据量计算

巧用微服务进行大数据量计算

2022-11-11 14:16:11 843

原创 在vscode创建python工程运行conda环境

在vscode创建python工程运行conda环境

2022-11-07 16:39:33 2665

原创 jdk8对Map集合进行排序

jdk8对Map集合进行排序

2022-09-07 14:55:43 937

原创 使用枚举方式消除if-else

使用枚举方式消除if-else

2022-08-23 15:35:43 61

原创 采用yarn方式启动spark-thriftserver

采用yarn方式启动spark-thriftserver

2022-08-16 18:12:14 1555

原创 spark-streaming 事件时间的窗口滑块(Window Operations on Event Time)实例

spark-streaming 事件时间的窗口滑块(Window Operations on Event Time)实例

2022-08-12 10:41:25 368

原创 spark报错:java.lang.String is not a valid external type for schema of bigint

spark报错:java.lang.String is not a valid external type for schema of bigint

2022-08-11 10:42:32 1247

原创 yarn怎样调度spark答疑

yarn怎样调度spark答疑

2022-08-08 15:13:11 543

原创 jdk8集合对象多属性去重

jdk8集合对象多属性去重

2022-06-24 17:17:26 596

原创 数据归一化处理

数据归一化1、最值归一化样本值 - 最小值 / (最大值 - 最小值)将所有数据映射到 0 - 1 之间 如果存在极值比如收入大部分人收入在1W 有些人收入在1000W2、均值方差(标准差)归一化样本值 - 均值 / 方差把所有数据归一到均值为0方差为1的分布中s²=((x1-x)²+(x2-x)²+···+(xn-x)²)/nnp.var(x)作用:衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。标准层差:s = sqrt(s²)

2022-06-10 17:03:45 5145

原创 KNN对手写数字进行识别超参数网格优化等

KNN对手写数字进行识别

2022-06-09 10:15:52 225

原创 使用KNN近邻算法学习鸢尾花数据

使用KNN近邻算法学习鸢尾花数据集

2022-06-08 17:51:02 85

原创 KNN近邻算法实现

KNN近邻算法

2022-06-08 10:11:48 146

原创 numpy系统学习

numpy 学习

2022-06-07 14:37:09 91

phoenix5.0.0支持flink1.6包dlink-connector-phoenix-1.16-0.7.3

phoenix5.0.0支持flink1.6插件 如果想看怎样实现异步博客 https://blog.csdn.net/u012228523/article/details/130811973

2023-06-01

flume支持RabbitMQ插件

flume支持RabbitMQ插件

2022-05-26

HA+keepalived+rabbitMq镜像集群安装手册软件

HA+keepalived+rabbitMq镜像集群安装手册软件

2022-05-25

comet4j-tomcat6-demo6.war

comet4j-tomcat6.jar通讯包适用于tomcat6,服务器与网页实现长连接消息推送

2016-09-07

json-lib.jar

这是用于在网站开发式,发送数据的。运用json插件方便

2014-03-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除