Spark用HiveUDF get_json_object内存泄漏问题
最新推荐文章于 2023-10-28 20:41:49 发布
博客讲述了在Spark中使用HiveUDF get_json_object时遇到的内存泄漏问题。通过分析Spark的源码和HiveUDF的实现,发现在多线程环境下,由于LinkedHashMap的非线程安全操作导致内存泄漏。解决方案是移除UDF中的HashCache,以避免内存问题。
摘要由CSDN通过智能技术生成