hadoop
文章平均质量分 68
ing X
这个作者很懒,什么都没留下…
展开
-
hadoop直接解压hdfs中的zip文件
公司需求上传zip文件到hdfs中,然后解压缩。百度很久没找到直接在hadoop中解压zip的方法。大多数都是使用java连接hdfs读取、解压缩、写回hdfs中,但是这样逃不开网络带宽的限制。所以就想能不能直接在hadoop环境中解压zip,想起之前使用自定义udf函数,便想试试把Java读取解压结合到udf中,然后使用hive或者impala直接在hadoop环境下执行。准备新建一个空的maven项目。依赖如下。(有些不一定用上了,反正全ctrl +c了) <dependency>原创 2021-09-02 17:35:03 · 4438 阅读 · 0 评论 -
impala添加自定义函数(MD5),以及Failure to find org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde解决
创建一个空得maven工程直接next -->finish。修改pom文件这是我得pom文件,一开始没有添加repositories节点,就报Failure to find org.pentaho:pentaho-aggdesigner-algorithm:pom:5.1.5-jhyde in。。。。得错误。网上说先下载再放到本仓库中,我试了也不行。最后添加了这个不报错了,这个帖子找到得<?xml version="1.0" encoding="UTF-8"?><proj原创 2021-07-09 16:19:47 · 649 阅读 · 0 评论