susalt-CSDN博客

原创在window下运行PySpark，将文件写入HDFS报错

原因：因为是在windows环境下执行PySpark程序，将文件写入HDFS中，windows用户权限不足。

2024-05-01 02:18:45 89 1

原创 pandas执行apply()函数时报错：TypeError: string indices must be integers

报错原因，在单列dataframe调用apply()函数，编写lambda表达式时，直接引用参数，不用传入"字段索引"引用相关列数据。在单列datafrma中使用apply()函数时，不需使用"字段索引"引用相关列数据，去掉"字段索引"列数据。TypeError：字符串索引必须是整数。

2023-11-16 16:12:51 307 1

原创 kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)

【代码】kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)

2023-10-28 16:06:47 345 1

转载 hive执行两表join时，on非相等条件，报错：Both left and right aliases encountered in JOIN ‘1‘

转载于：https://blog.csdn.net/youhuakongzhi/article/details/109515659。hive执行JOIN时，不支持两个表的字段的非相等操作；

2023-10-07 23:37:44 521 1

转载 DBeaver执行HQL报错:org.apache.hadoop.security.AccessControlException

DBeaver连接Apache Hive数据仓库后，执行DDL语句，报错：org.apache.hadoop.security.AccessControlException等。

2023-09-30 14:46:40 198

布隆过滤器是一种数据结构，它可以用于检索一个元素是否在一个集合中。它是由布隆在1970年提出的一种有效的数据结构，被广泛应用于各种场景，例如网络爬虫的URL去重、垃圾邮件的过滤等。布隆过滤器实际上是一个很长的二进制向量和一系列随机映射函数。它通过将一个元素映射到一个位阵列（Bit array）中的某个点，然后查看这个点是不是1来判断集合中是否存在这个元素。具体来说，它通过一个哈希函数将一个元素映射成一个位阵列中的位置，如果这个位置的值为1，则认为集合中存在这个元素。

2023-09-28 16:27:01 391 1

转载 Joplin实现侧边栏目录

本文章转载自：https://lightzhan.xyz/index.php/2020/11/22/joplin-toc-customizing/

2023-09-27 20:36:43 1932 11

转载 pandas读取json格式log文件，报错：ValueError: Trailing data

json格式文件是按行存储数据，使用pandas的read_json()读取json格式文件时，没有在read_json()中指定参数"lines"为"True";

2023-09-24 16:33:57 862 2

qq_45993667的博客