大数据
大数据组件
王壮_
大数据、Python、Java、前端
展开
-
DataX导入数据从FTP到HDFS的Json配置文件
【代码】DataX导入数据从FTP到HDFS的Json配置文件。原创 2024-04-03 15:56:28 · 389 阅读 · 1 评论 -
python操作HBase
【代码】python操作HBase。原创 2024-01-10 20:11:01 · 957 阅读 · 1 评论 -
Hive报错__FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
增加 Java 堆空间:您可以通过调整 MapReduce 任务的 JVM 参数来增加 Java 堆空间,例如通过 -Xmx 参数来增大最大堆内存,或者通过 -XX:MaxHeapSize 参数来增加最大堆大小。检查语句逻辑和数据:检查您要执行的 Hive 查询的语法和逻辑是否正确,以及涉及的数据是否符合预期,有时候错误的查询语句或者不符合预期的数据会导致任务执行失败。增加集群资源:如果可能的话,增加集群的物理资源,例如增加节点数、增加每个节点的内存等,以便更好地支持大规模数据处理任务。原创 2023-12-28 10:45:32 · 1180 阅读 · 1 评论 -
Hive报错:自定义函数找不到第三方jar包 java.lang.NoClassDefFoundError: com/alibaba/fastjson/JSON
hive-evn.sh配置文件中搜索HIVE_AUX_JARS_PATH。HIVE_AUX_JARS_PATH=jar包1路径:jar包2路径。原创 2023-12-28 12:19:47 · 528 阅读 · 1 评论 -
Sqoop报错Caused by: java.lang.RuntimeException: Can‘t parse input data: ‘王五‘
这样 Sqoop 将知道如何正确地映射数据类型,避免将字符串字段解析为整数。方法中,尝试将字符串 "张三" 解析为整数时发生了。在 Sqoop 导出命令中使用。在 Sqoop 导出命令中使用。根据之前的错误信息,看起来在。字段是字符串类型,不应该在。选项指定要导出的列,排除。选项明确指定字段映射。方法中被解析为整数。原创 2023-12-20 11:54:12 · 741 阅读 · 1 评论