HIve：创建hive表并通过HDFS文件进行导入数据（速度最快）

最新推荐文章于 2024-08-25 03:54:55 发布

小栋哟

最新推荐文章于 2024-08-25 03:54:55 发布

阅读量6.2k

点赞数 2

分类专栏： HDFS Hive 文章标签： HDFS Hive 导入大数据

本文链接：https://blog.csdn.net/xiaodongge521/article/details/103314460

版权

Hive 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

HDFS

1 篇文章 0 订阅

订阅专栏

最近这个项目做hive建表在导入数据的时候，数据量大的时候难免会慢一点，现在又发现了一种新的导入数据方式；

使用hdfs的文件进行导入，所以要使用的话就得先把文件上传到hdfs再操作

三个前提：1.文件必须已经上传到hdfs，否则不行。2.这个表必须是不存在的，不能在已表上进行叠加数据；3.必须是目录级别，不能具体到文件；如果目录底下有多个文件，将会把所有文件数据都导入进去；如果正好需要将目录下所有文件都导入那就最合适了。

如果都可以满足那就接着往下看吧，

    @Test
    public void createHiveTableAndData() {
        String sql = "create external table 库.表名(\n" +
                "id string\n" +
                ",names string\n" +
                ",sex string\n" +
                ",age string\n" +
                ",psd string\n" +
                ",post string\n" +
                ")\n" +
                "row format delimited fields terminated by ','\n" +
                "stored as textFile\n" +
                "location '/dataFiles/offlineFile/201911280/'";
         hiveJdbcBaseDaoImpl.getJdbcTemplate().execute(sql);

    }

就是一个建表语句，默认是 , 进行分割，我使用的是csv和json两种格式；

"location '/dataFiles/offlineFile/201911280/'"; 这个目录就是hdfs目录

这是我目前知道的最快方式，之前用的都是 load data local inpath 方式；

   String  sql = "load data local inpath '" + filepath + "' into table person" ;

如果有兴趣需要了解可以在找我其他博客。基本都有更新；

有更好的方式还请留言讨论 ~ 或者+q：983469079

小栋哟

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录