hive 导入导出csv文件

jin_tmac

已于 2024-06-06 10:38:26 修改

阅读量6.4k

点赞数 3

分类专栏： Spark 文章标签： hive hadoop 大数据

于 2022-09-14 12:19:25 首次发布

本文链接：https://blog.csdn.net/jin_tmac/article/details/126850175

版权

Spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1、导入
将CSV文件导入到hive数据库，具体操作如下，
首先在hive中创建自己的table, 并且设置以逗号分隔。

create table if not exists tmp.hb_label_C(
sample_cat string,
reg_mob_md5 string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;

然后

desc formatted  tmp.hb_label_C

确定tmp.hb_label_C表的分布式文件路径

最后在linux命令行输入

hdfs dfs -put label_C.csv hdfs://nameservice1/user/hive/warehouse/tmp.db/hb_label_C

查看结果

select * from tmp.hb_label_C limit 10;

2、导出

使用beeline重定向

beeline -e "select * from tmp.install_uninstall_pred_res_online_v1 where tail<=9" > hb_torch_feature.csv

同时使用以下方式导出数据带表头

beeline -e "select * from tmp.install_uninstall_pred_res_online_v1 where tail<=9"  |sed '1s/^/md5_phone\n/' > hb_torch_feature.csv

hive-cli 方式

hive -e "set hive.cli.print.header=true;select * from test.jxb_fpd_agr1_all_0905;" |grep -v "WARN" | tr "\t" "," > /jinxb/result/test.csv

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jin_tmac

关注关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

将CSV文件导入到hive数据库

杨鑫newlife的专栏

05-26

2万+

将CSV文件导入到hive数据库

Hive系统配置及数据导入--【导入csv文件】

weixin_45044349的博客

10-22

3001

1、安装Hadoop环境、并安装Hive。 (1)方法一(使用官方教程安装) ①按照之前的课程或者官方文档安装Hadoop环境(单节点) https://hadoop.apache.org/docs/r2.10.1/hadoop-project-dist/hadoop-common/SingleCluster.html ②按照官方文档安装Hive2 https://cwiki.apache.org/confluence/display/Hive/GettingStarted (2)方法二(使用已有的Hive

参与评论您还未登录，请先登录后发表或查看评论

Hive csv文件导入Hive

文文x的博客

11-23

1461

【代码】Hive csv文件导入Hive。

hive load csv 文件

热门推荐

松门一枝花

09-23

2万+

Hive 使用如下FileFormat 类读写 HDFS files: TextInputFormat/HiveIgnoreKeyTextOutputFormat: 读写普通HDFS文本文件. SequenceFileInputFormat/SequenceFileOutputFormat: 读写SequenceFile格式的HDFS文件. Hive 使用如下SerDe 类(反)序列

csv 文件导入hive

04-24

数据文件

csv文件导入hive表

后知后觉的it路

02-04

2967

1 csv格式(就是讲mysql表数据通过Sqlyog 导出时，默认的导出文件格式) 　　CSV格式的文件也称为逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号。在本文中的CSV格式的数据就不是简单的逗号分割的），其文件以纯文本形式存储表格数据（数字和文本）。CSV文件由任意数目的记录组成，记录间以某...

hive 导出CSV

c861288068的博客

02-27

206

--hive 导出CSV hive -e "SET hive.support.concurrency=true; SET hive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DbTxnManager; set hive.cli.print.header=true; select key_id, item_id, policy_id, grp_policy_id, grp_item_id, pay_no, organ_id, agency_i

hive中导入csv_hadoop hive中怎么导入带引号的csv文件?

weixin_39531780的博客

12-20

1110

这边有个项目开始用hadoop来做数据分析,我们拿到一个csv文件,每一列都是双引号.格式如下“cola1″,”colb1″,”colc1”“cola2″,”colb2″,”colc2”现在想问下,在load数据到hive里面怎么过滤掉这个双引号?—————————–update 20140626—————————-–能导成CSV的数据，真的需要用Hive吗？导给MySQL是不是更好？现在还在de...

oracle,teradata,hive,gbase,db2数据库导出csv命令总结

04-12

### Oracle、Teradata、Hive、GBase、DB2 导出 CSV 文件命令总结 #### 一、Oracle 数据库导出 CSV 文件 ##### 1. 通过 Spool 指令实现 Oracle 提供了 `spool` 命令来帮助我们将查询结果输出到一个文本文件中，...

hbase导出csv，文本，html文件

03-01

6. **终端mac查询脚本**：在Mac终端中，可以编写shell脚本来自动化这些过程，包括执行HBase查询、Hive操作、数据库导入导出等，以提高效率和减少手动错误。这个流程体现了大数据处理中的一种典型数据流：从NoSQL...

hive中导入csv,本地CSV导入hive表

weixin_42633137的博客

03-19

527

背景从mysql 导出的数据保存为csv文件导出两个文件，一个有csv的文件头 record1.csv一个没有csv文件的文件头 record0.csvtry1建表语句直接导入sql='''CREATE TABLE IF NOT EXISTS default.records(exer_recore_id BIGINT,user_id int,channel tinyint,item_id i...

hive中表数据的导入和导出

m0_45847655的博客

08-26

1032

hive中表数据的导入和导出

Hive 导出数据到 CSV 文件

JIE的博客 --- moon_coder

11-12

6206

spark 导出的是一个目录，我们需要拿到目录下的 csv 文件。最后，按题目要求改成指定路径与名称就可以啦，这里就不操作了。在 spark-shell 中导出。直接在 Hive 界面中进行操作。：以带表头的方式查询。的就是我们的结果文件。

安装Hive并导入csv文件

u013666742的专栏

07-03

990

安装Hive并导入csv文件

导入CSV文件到Hive

wachoo的blog

03-18

6857

导入csv文件到Hive中orc表，需要注意的事项

hive：导入CSV文件

不花的花和尚的博客

06-27

1万+

一个导入案例： CREATE TABLE tmp.csv_t1 ( a string, b string, c string ) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ( ...

【HIVE】 hive 导入导出csv(全)

Zsigner的博客

12-21

3892

Hive 导入csv文件H 1、检查是否有hive-serde 包 1.1 进入hive lib目录 cd /usr/local/service/hive/lib 1.2 发现hive version 是2.1.1 ，查看是否添加了hive-serde-2.1.1.jar（我这里已经添加了，没添加的看后续1.3） ll hive-serde-2.1.1.jar 1.3 没添加的，直接下载，放到lib目录下 cd /usr/local/service/hive/lib...

从pg导出文件，导入HIVE

05-24

要将pg导出文件导入到Hive中，你需要使用以下步骤： 1. 将pg导出文件转换为CSV格式，可以使用以下命令将pg导出文件转换为csv格式： ``` $ pg_dump -h <host> -p <port> -U <username> -F p -b -v -f <filename> <database> $ pg_dump -t <table_name> -a -F c -b -v -f <filename> <database> $ pg_restore -F c -v <filename> | psql -h <host> -p <port> -U <username> -d <database> ``` 2. 使用Sqoop将CSV文件导入到Hive中，可以使用以下命令将CSV文件导入到Hive中： ``` $ sqoop import --connect jdbc:postgresql://<host>:<port>/<database> --username <username> --password <password> --table <table_name> --fields-terminated-by ',' --hive-import --create-hive-table --hive-table <hive_table_name> ``` 其中，<host>、<port>、<username>、<password>、<database>、<table_name>和<hive_table_name>分别为PostgreSQL数据库的相关信息和Hive表的相关信息。