csv文件如何上传到hive数据库

最新推荐文章于 2024-11-21 17:51:15 发布

原创最新推荐文章于 2024-11-21 17:51:15 发布 · 2.6k 阅读

9 ·

CC 4.0 BY-SA版权

本文介绍了一种从CSV格式文件导入数据到Hive表的具体步骤，包括设置CSV格式、创建Hive表、上传文件到服务器、将文件放入Hadoop、加载数据到Hive表以及检查数据插入情况。

1.将文件设置为csv格式文件，数据之间用逗号隔开，尤其是日期数据，要保证将日期数据转换为文本格式。范例如下：

dim_budget.csv
JDDJ,92,1,2020-6-1,17734.1471445513,17734.1471445513,2020-6-28 15:25
JDDJ,92,10,2020-6-1,72548.7837731644,72548.7837731644,2020-6-28 15:25
JDDJ,92,12,2020-6-1,33856.0990941434,33856.0990941434,2020-6-28 15:25
JDDJ,92,13,2020-6-1,40304.8798739802,40304.8798739802,2020-6-28 15:25

2.在hive上创建对应的表

create table dim_budget (
   channel string COMMENT '渠道号',
   dept int COMMENT '部门号',
   cat int COMMENT '品类号',
   budget_date date COMMENT '日期',
   budget decimal(30,4) COMMENT '预算金额',
   target decimal(30,4) COMMENT '最低预算金额',
   upd_ts timestamp COMMENT '数据更新时间戳'
  )comment 'budget表'
  row format delimited fields terminated by ','
 STORED AS textfile;
;

3.将csv文件上传到服务器的~/

scp dim_budget.csv 用户名@服务器名:~/

4.将dim_budget.csv文件放入到Hadoop中

Hadoop fs -put dim_budget.csv /tmp

5.在hive中将数据加载进表里

load data inpath '/tmp/dim_budget.csv' into table budget

6.检查数据是否正常插入进数据库

select * from budget ;

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陈小白成长记

关注关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

hive 导入导出csv文件

jin_tmac's studio

09-14

7432

首先在hive中创建自己的table, 并且设置以逗号分隔。确定tmp.hb_label_C表的分布式文件路径。将CSV文件导入到hive数据库，具体操作如下，最后在linux命令行输入。

hive中导入csv,本地CSV导入hive表

weixin_42633137的博客

03-19

625

背景从mysql 导出的数据保存为csv文件导出两个文件，一个有csv的文件头 record1.csv一个没有csv文件的文件头 record0.csvtry1建表语句直接导入sql='''CREATE TABLE IF NOT EXISTS default.records(exer_recore_id BIGINT,user_id int,channel tinyint,item_id i...

参与评论您还未登录，请先登录后发表或查看评论

技巧-如何通过hive开发平台上传csv文件

weixin_30673611的博客

05-10

406

通过数据交换平台上传较大的文件时，经常会出现导入失败情况，换种方式通过新数据开发平台（stark）也可以轻松实现外部数据与hive的数据关联。第一步、导入csv文件到hive stark数据开发平台——>资源管理——>搜索栏右边+号——>上传资源（资源类型：选择普通文件）第二步、建表并让这张表关联上上传的csv文件 ...

csv 文件导入hive

04-24

数据文件

大数据学习-hive（一：如何上传csv数据到hive表）

weixin_43446246的博客

02-15

2641

一：建表 create table temp.dim_dk_vehicle_info_01 ( ecu_id string ,key_type string ,status string )comment 'tmp中dim层车辆维度信息表' row format delimited fields terminated by ',' collection items terminated by '\n' stored as textfile ; 表存储格式为textfile。

hive中导入csv_将CSV文件导入到hive数据库

weixin_39616686的博客

12-20

1965

将csv文件导入hive后出现了所有的字段只显示在新建的表的第一个字段中，后面的字段全是null.出现这种的原因是hive以行分隔数据，需要修改为按逗号' , ‘ 进行分隔读取，具体操作如下，首先在hive中创建自己的table, 并且设置以逗号分隔。create table IP(ip varchar(30), country varchar(30), province varchar(3...

精选资源

将csv文件放到hive对应的服务器上

04-13

1、问题描述将“數倉數據提供與報表流程開發\码表导入\TY”中csv内容导入hive的码表当中。...2、将csv文件放到hive对应的服务器上 hadoop服务器：10.176.153.32 1、将sfc_b_phase.csv放在32的root目录下。

如何将本地csv文件导入hive数据库的表中

最新发布

11-28

将本地 CSV 文件导入 Hive 数据库表，可按以下操作进行： 1. **创建 Hive 表**：创建与 CSV 文件结构匹配的 Hive 表，指定合适的数据类型和分隔符。 ```sql CREATE TABLE test.cde_map_info_load ( sys_sign STRING...

shell脚本导出hive数据库和表信息到csv(数据资产盘点)

weixin_52305312的博客

04-02

3157

当我们想统计下现有的数据库下有哪些表,以及表的相关信息,需要做数据资产盘点,发现数据库和表太多的时候,当然是想通过脚本自动的去获取,以下脚本实现了扫描hive库下的表信息并输出到csv # 获取所有数据库 databases=(`hive -e "show databases;"`); # 遍历得到每个数据库 for database in ${databases[*]} do # 获取得到数据库下所有表 tables=(`hive -e "use ${database};show tabl

Hive csv文件导入Hive

文文x的博客

11-23

1678

【代码】Hive csv文件导入Hive。

hive中导入csv,把csv导入到hive表中步骤

weixin_42412250的博客

03-19

1588

本博文解决的问题：现在我们有一个CSV格式的一个文件download.csv，里面是我们需要的数据，想把数据装入到数据impala数据库中1.首先整理文本文件打开download.csv，选择文件，另存为，保存类型：制表符分隔.txt2.创建表drop table if exists test.cde_map_info_load;CREATE TABLE test.cde_map_info_lo...

导入CSV文件到Hive

wachoo的blog

03-18

7126

导入csv文件到Hive中orc表，需要注意的事项

hive中导入csv_hive导入数据的三种方式

weixin_39843338的博客

12-20

3773

首先我们在hive中要建好一个表，这里用比较难的方式来假设，假设是外部表并且是分区表stg.test，按bus_date(string)分区。方式一：上传数据后修复首先上传数据到HDFS中：hadoop fs -mkdir -p /user/hive/warehouse/stg/test/bus_date=20191101 #创建文件夹hadoop fs -put /opt/datas/test....

CSV文件数据导入hive

baidu_41805096的博客

11-21

1333

如果不使用tblproperties(“skip.header.line.count”=“1”)，也可用sed -i ‘1d’ 文件名删除文件首行。1、Hive上建表，通常会指定字段分隔符为逗号（row format delimited fields terminated by ‘,’ ）以csv 文件中出现字段中含有逗号的场景为例：{“2020”: “1”,“2022”: “8”,“2024”: “25”}此处的文件目录是linux本地文件目录，所以是LOCAL INPATH。

Hive系统配置及数据导入--【导入csv文件】

weixin_45044349的博客

10-22

3151

1、安装Hadoop环境、并安装Hive。 (1)方法一(使用官方教程安装) ①按照之前的课程或者官方文档安装Hadoop环境(单节点) https://hadoop.apache.org/docs/r2.10.1/hadoop-project-dist/hadoop-common/SingleCluster.html ②按照官方文档安装Hive2 https://cwiki.apache.org/confluence/display/Hive/GettingStarted (2)方法二(使用已有的Hive

本地文件上传至HDFS中的命令

Matrix70的博客

12-20

1618

本地上传文件至hadoop

CSV文件导入到EXCEL中

sn5diphone6的博客

10-08

1732

2. 选择数据--》从文本/CSV ，选中要导入的txt文件或csv文件。5.新的弹框中，选择拆分列，按分隔符拆分，默认会选中文本中的分隔符，点确定。3. 在弹框中，调整合适的文本格式以正确显示内容，比如选择：UTF-8。A★B★C 分隔符为 ★，可以替换为其他分隔符。6. 选择关闭并上载，数据会导入到EXCEL文件中。1. 新建一个EXCEL文件，并打开。4. 弹框右下角，选择转换数据。

【实用技巧】将本地csv文件导入到hive中

gecko

11-24

3347

step1：在hive中创建表test01，并使用命令"show create table 表名"，得到该表存放的hdfs文件路径（数据入库时需要用到）step3：进入HDFS下的hadoop下的bin目录，并将a.csv文件放在该目录下。命令格式：./hdfs dfs -put 数据存放路径数据表在hdfs文件路径。step2：使用vim创建文件a.csv,并存入数据。step4：执行命令。

将csv文件插入hive（Python代码）

WHYbeHERE的博客

11-29

872

将csv文件插入hive（Python代码）

DataX 导入 CSV文件中的数据到 Hive 数据库中

06-08

我们已知用户真正需求是：如何使用DataX将CSV文件导入到Hive数据库注意：用户之前可能被误导以为需要安装csvfilereader插件，但实际上DataX默认提供的是csvreader插件根据DataX官方文档和实际使用，DataX的CSV读取...