自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 在window下运行PySpark,将文件写入HDFS报错

原因:因为是在windows环境下执行PySpark程序,将文件写入HDFS中,windows用户权限不足。

2024-05-01 02:18:45 89 1

原创 【无标题】hive外部表删除后,重建,恢复分区数据

hive

2024-04-09 02:12:26 408 1

原创 pandas执行apply()函数时报错:TypeError: string indices must be integers

报错原因,在单列dataframe调用apply()函数,编写lambda表达式时,直接引用参数,不用传入"字段索引"引用相关列数据。在单列datafrma中使用apply()函数时,不需使用"字段索引"引用相关列数据,去掉"字段索引"列数据。TypeError:字符串索引必须是整数。

2023-11-16 16:12:51 307 1

原创 kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)

【代码】kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)

2023-10-28 16:06:47 345 1

转载 hive执行两表join时,on非相等条件,报错:Both left and right aliases encountered in JOIN ‘1‘

转载于:https://blog.csdn.net/youhuakongzhi/article/details/109515659。hive执行JOIN时,不支持两个表的字段的非相等操作;

2023-10-07 23:37:44 521 1

转载 DBeaver执行HQL报错:org.apache.hadoop.security.AccessControlException

DBeaver连接Apache Hive数据仓库后,执行DDL语句,报错:org.apache.hadoop.security.AccessControlException等。

2023-09-30 14:46:40 198

原创 利用Python实现BloomFiter(布隆过滤器)

布隆过滤器是一种数据结构,它可以用于检索一个元素是否在一个集合中。它是由布隆在1970年提出的一种有效的数据结构,被广泛应用于各种场景,例如网络爬虫的URL去重、垃圾邮件的过滤等。布隆过滤器实际上是一个很长的二进制向量和一系列随机映射函数。它通过将一个元素映射到一个位阵列(Bit array)中的某个点,然后查看这个点是不是1来判断集合中是否存在这个元素。具体来说,它通过一个哈希函数将一个元素映射成一个位阵列中的位置,如果这个位置的值为1,则认为集合中存在这个元素。

2023-09-28 16:27:01 391 1

转载 Joplin实现侧边栏目录

本文章转载自:https://lightzhan.xyz/index.php/2020/11/22/joplin-toc-customizing/

2023-09-27 20:36:43 1932 11

转载 pandas读取json格式log文件,报错:ValueError: Trailing data

json格式文件是按行存储数据,使用pandas的read_json()读取json格式文件时,没有在read_json()中指定参数"lines"为"True";

2023-09-24 16:33:57 862 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除