1.将文件设置为csv格式文件,数据之间用逗号隔开,尤其是日期数据,要保证将日期数据转换为文本格式。范例如下:
dim_budget.csv
JDDJ,92,1,2020-6-1,17734.1471445513,17734.1471445513,2020-6-28 15:25
JDDJ,92,10,2020-6-1,72548.7837731644,72548.7837731644,2020-6-28 15:25
JDDJ,92,12,2020-6-1,33856.0990941434,33856.0990941434,2020-6-28 15:25
JDDJ,92,13,2020-6-1,40304.8798739802,40304.8798739802,2020-6-28 15:25
2.在hive上创建对应的表
create table dim_budget (
channel string COMMENT '渠道号',
dept int COMMENT '部门号',
cat int COMMENT '品类号',
budget_date date COMMENT '日期',
budget decimal(30,4) COMMENT '预算金额',
target decimal(30,4) COMMENT '最低预算金额',
upd_ts timestamp COMMENT '数据更新时间戳'
)comment 'budget表'
row format delimited fields terminated by ','
STORED AS textfile;
;
3.将csv文件上传到服务器的~/
scp dim_budget.csv 用户名@服务器名:~/
4.将dim_budget.csv文件放入到Hadoop中
Hadoop fs -put dim_budget.csv /tmp
5.在hive中将数据加载进表里
load data inpath '/tmp/dim_budget.csv' into table budget
6.检查数据是否正常插入进数据库
select * from budget ;
本文介绍了一种从CSV格式文件导入数据到Hive表的具体步骤,包括设置CSV格式、创建Hive表、上传文件到服务器、将文件放入Hadoop、加载数据到Hive表以及检查数据插入情况。
7432

被折叠的 条评论
为什么被折叠?



