- 博客(9)
- 收藏
- 关注
原创 在window下运行PySpark,将文件写入HDFS报错
原因:因为是在windows环境下执行PySpark程序,将文件写入HDFS中,windows用户权限不足。
2024-05-01 02:18:45 89 1
原创 pandas执行apply()函数时报错:TypeError: string indices must be integers
报错原因,在单列dataframe调用apply()函数,编写lambda表达式时,直接引用参数,不用传入"字段索引"引用相关列数据。在单列datafrma中使用apply()函数时,不需使用"字段索引"引用相关列数据,去掉"字段索引"列数据。TypeError:字符串索引必须是整数。
2023-11-16 16:12:51 307 1
原创 kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)
【代码】kafka报错:[test_topic=LEADER_NOT_AVAILABLE](org.apache.kafka.client.NetworkClient)
2023-10-28 16:06:47 345 1
转载 hive执行两表join时,on非相等条件,报错:Both left and right aliases encountered in JOIN ‘1‘
转载于:https://blog.csdn.net/youhuakongzhi/article/details/109515659。hive执行JOIN时,不支持两个表的字段的非相等操作;
2023-10-07 23:37:44 521 1
转载 DBeaver执行HQL报错:org.apache.hadoop.security.AccessControlException
DBeaver连接Apache Hive数据仓库后,执行DDL语句,报错:org.apache.hadoop.security.AccessControlException等。
2023-09-30 14:46:40 198
原创 利用Python实现BloomFiter(布隆过滤器)
布隆过滤器是一种数据结构,它可以用于检索一个元素是否在一个集合中。它是由布隆在1970年提出的一种有效的数据结构,被广泛应用于各种场景,例如网络爬虫的URL去重、垃圾邮件的过滤等。布隆过滤器实际上是一个很长的二进制向量和一系列随机映射函数。它通过将一个元素映射到一个位阵列(Bit array)中的某个点,然后查看这个点是不是1来判断集合中是否存在这个元素。具体来说,它通过一个哈希函数将一个元素映射成一个位阵列中的位置,如果这个位置的值为1,则认为集合中存在这个元素。
2023-09-28 16:27:01 391 1
转载 Joplin实现侧边栏目录
本文章转载自:https://lightzhan.xyz/index.php/2020/11/22/joplin-toc-customizing/
2023-09-27 20:36:43 1932 11
转载 pandas读取json格式log文件,报错:ValueError: Trailing data
json格式文件是按行存储数据,使用pandas的read_json()读取json格式文件时,没有在read_json()中指定参数"lines"为"True";
2023-09-24 16:33:57 862 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人