青云游子-CSDN博客

原创 Python解释器（Interpreter）

Python代码执行过程包括编译和解释两个阶段：源代码先被编译为字节码(.pyc)，再由解释器通过Python虚拟机(PVM)转换为机器码。CPython是最常用的解释器，而PyPy采用了JIT(即时编译)技术，能够将热点代码直接编译为机器码缓存以提高性能。整个过程包含源代码→AST→字节码→机器码的转换，若源码未修改则只需编译一次字节码。JIT技术的关键在于将频繁执行的字节码编译为可缓存的机器码，从而避免重复解释。

2026-03-14 10:55:50 43

原创 Linux 搜索压缩包内容

zgrep -a bbb * | zgrep PUT

2025-06-12 16:38:56 105

原创 spark，使用union之后，插入hive报错，或者分区多出一层

万能解决办法：先把数据收集到Driver，创建临时视图，再写入a表。

2025-01-17 13:46:06 366

原创 spark，读取和写入同一张表问题

2.读取上来之后，创建为临时视图temp，然后先写入a表，再使用temp，就会报错。4.万能解决办法：先把数据收集到Driver，创建临时视图，再写入a表。解决办法：先把数据收集到Driver，创建临时视图，再写入a表。解决办法：可以先使用temp，再写入a表。3.写入的不是分区表，会报错。1.写入的是分区表，不报错。

2025-01-16 22:37:43 765

原创 pyspark头部代码

【代码】pyspark头部代码。

2024-11-13 12:56:47 182

原创 python捕获异常

【代码】python捕获异常。

2024-11-13 12:47:17 156

原创 python使用for循环

【代码】python使用for循环。

2024-11-13 12:41:29 176

原创 python抛出异常

【代码】python抛出异常。

2024-11-13 12:37:05 186

原创 pySpark乱码

python的变量包含中文，用format放入SQL中时，出现乱码。使用python3，并且把所有print，改成带括号的。python2默认编码是ascii。

2024-11-13 12:26:51 346

原创 yarn,查看最后几行日志

【代码】yarn,查看最后几行日志。

2024-10-24 15:49:40 471

原创 spark，poi，jar包冲突(commons.io)

【代码】spark，poi，jar包冲突(commons.io)

2024-09-25 21:20:56 619

原创 hive客户端

Beeline是Hive的JDBC客户端工具，可以通过Beeline连接到Hive Server2。

2024-08-24 15:30:52 489

原创查看WiFi密码

Win + Rcmd：：WiFi名。

2024-08-06 20:01:06 932

原创 Java，BigDecimal转换为int类型，数据精度丢失

如果 `BigDecimal` 的值超出了 `int` 类型能表示的范围，即整数的最大值 `Integer.MAX_VALUE` （2147483647）或最小值 `Integer.MIN_VALUE`（-2147483648），该方法会返回一个截断的结果。在你的情形中，`resultBigDecimal` 的值是 `-2.3785548E+19`，远远超过了 `int` 类型的最小负值。因此，转换到 `int` 时，发生了数值的溢出和环绕，从而导致返回的结果为 2147434496。

2024-04-24 14:30:43 953

原创 doris备份恢复bug

1.原表是3个副本，备份，恢复的时候指定1，恢复的建表语句显示是3，以后新插入的分区，副本是3，容易导致数据丢失。2.原表是1个副本，备份，恢复的时候指定1，恢复的建表语句显示是3，以后新插入的分区，副本是3。

2024-04-17 16:00:01 641 1

原创 doris导入Excel的xlsx格式数据

1.把xlsx格式另存为csv格式。2.上传到Linux。4.转换为utf-8。

2024-02-01 21:11:14 1045

原创 doris建表报错:Failed to find 3 backends for policy

【代码】doris建表报错:Failed to find 3 backends for policy。

2024-01-31 18:19:21 938

原创 spark写入hive，字段不够长，会截断数据

spark写入hive，字段不够长，会截断数据。hive的字段都设置成 string 类型。

2024-01-31 15:29:27 279

原创 doris修改列类型

【代码】doris修改列类型。

2024-01-30 17:07:30 1952

原创 doris批量创建分区，shell脚本

【代码】doris批量创建分区，shell脚本。

2024-01-30 16:44:21 579

原创 fastjson2序列化报错OutOfMemoryError

报错如下，这里用的是阿里的com.alibaba.fastjson2，该版限制了最大可以大小是64M，超过了就报错OutOfMemoryError。

2024-01-29 19:29:20 2219

原创解决FileNotFoundException: D:\decode.dll (另一个程序正在使用此文件，进程无法访问)问题

在静态代码块中加载decode.dll。

2024-01-18 16:46:17 483

原创 hive数据量不一致，表1是5条，导入到表2，变成了10条

hive的数据里面，有脏数据，比如某个字段中的数据有换行符、\n。如果hive设置的参数，换行符正好是\n，那么数据就会变多。

2024-01-17 16:40:51 581

原创 spark写hive的ORC表，count(*)没数据

使用spark向hive中插入数据，hive表是ORC表。解决办法：在后面加 limit 1 解决。然后查询数据，发现数据是164条。然后用SQL查询数量，结果是0。

2024-01-16 10:52:02 612

原创 MySQL自动更新时间字段

自动更新当前时间戳（当任何字段的值被更新时，该字段会自动更新为当前时间）添加一个自动更新的时间戳字段。

2024-01-10 19:10:15 789

原创 flink自动发现kafka新增分区

如果flink程序在运行中，kafka新增了分区，flink程序是消费不了的，需要重启flink程序，然后重置kafka的offset。

2024-01-10 19:00:05 896

原创 doris，DUPLICATE KEY类型不支持update

明细表只能支持insert/delete，不支持update语句。update需要通过delete+insert实现。

2024-01-10 14:14:51 1304

原创 MySQL，原子性rename

【代码】MySQL，原子性rename。

2024-01-10 14:02:20 506

原创 doris批量创建分区

注意，以上"FROM(...) TO (...) INTERVAL ..."这种批量创建分区后面指定的INTERVAL还可以指定成YEAR、MONTH、WEEK、DAY、HOUR。

2024-01-10 13:59:59 732

原创 FlinkSQL设置sink的并行度

【代码】FlinkSQL设置sink的并行度。

2024-01-03 18:35:32 1490

原创 spark报错：com.fasterxml.jackson.databind.JsonMappingException: Incompatible Jackson version: 2.9.0

解决办法。

2023-12-22 10:48:38 329

原创 Spark读取S3数据

参考：http://t.csdnimg.cn/9qRuN

2023-12-20 15:29:55 272

原创 flink1.12.4消费kafka 报错 The coordinator is not available

但是任务还在正常跑.

2023-12-08 09:43:01 1309 1

原创 flink获取kafka的key value timestamp header

参考：

2023-12-03 13:57:57 331

原创 flink报错：akka.pattern.AskTimeoutException: is that the recipient actor didn‘t send a reply

在flink-conf.yaml中添加或修改：akka.ask.timeout: 100s web.timeout: 100000。如果负载或网络问题无法彻底缓解，需考虑调大 akka.ask.timeout 参数的值（默认只有 10 秒）；Akka 超时导致，一般有两种原因：一是集群负载比较大或者网络比较拥塞，二是业务逻辑同步调用耗时的外部服务。另外，调用外部服务时尽量异步操作（Async I/O）

2023-11-23 14:51:22 1102

原创算法通关村第一关挑战——帮鱼皮打印算法学员名单

【代码】算法通关村第一关挑战——帮鱼皮打印算法学员名单。

2023-11-22 14:16:20 168

原创算法通关村第一关——链表白银挑战笔记

这是一道经典的链表问题 : 输入两个无环的，找出它们的第一个公共结点，如果没有公共节点则返回空。屡试不爽的方法: 将和常用算法思想都想一遍，看看哪些能解决问题。常用的数据结构有数组、链表、队、栈、Hash、集合、树、堆。常用的算法思想有查找、排序、双指针、递归、迭代、分治、贪心、回溯和动态规划等等。首先想到的是蛮力法，类似于冒泡排序的方式，将第一个链表中的每一个结点依次与第二个链表的进行比较，当出现相等的结点指针时，即为相交结点。虽然简单，但是时间复杂度高，排除!

2023-11-20 16:05:05 245

原创报错doris Doris BrokerLoad No source file in this table

查看hive的建表语句，找到location路径，复制到 DATA INFILE 即可。

2023-11-16 10:29:31 531

原创 MySQL on duplicate key update用法

如果数据库有值，不想覆盖数据库的值，可以采用以下写法。

2023-11-11 13:07:51 653

原创算法通关村第一关——链表青铜挑战笔记

在给插入的新节点连线时不能先把目标节点的前个节点的指针指向新节点。（2）删除中间节点直接将要删除节点的上一个节点的指针指向删除节点的下一个节点即可。（2）在中间增加元素要注意的问题是我们必须要遍历到目标节点的前一个节点停下，要先等目标节点的前个节点的指针的指针先连到目标节点才行。（1）删除首部节点直接将head指向旧头部节点改为指向新头部节点即可。（3）删除尾部节点直接将旧尾部节点的上一个节点的指针指向null即可。（3）在尾部增加元素直接将旧尾部节点指向新尾部节点就行了。

2023-11-03 08:51:04 288

空空如也

空空如也