Hive 复制表结构、表数据以及数据库迁移

1、复制表或者迁移数据库

CREATE TABLE new_table AS SELECT * FROM old_table;(非分区)

create table t_copy like t_part;(分区表)

2、复制数据

查看老表的hdfs文件位置 (show create table xxx;) old_file_path

查看新表的hdfs文件位置 new_file_path;

hdfs复制:hadoop fs -cp old_file_path new_file_path;

3、修复元数据

MSCK REPAIR TABLE new_table;修复新表的分区元数据。

数据从Oracle数据库迁移Hive中可以采用以下步骤: 1.安装Hive,配置Hive环境变量 2.安装Sqoop,配置Sqoop环境变量 3.创建Hive结构 4.使用Sqoop将Oracle数据导入到Hive中 具体步骤如下: 1.安装Hive,配置Hive环境变量 需要下载并安装Hive,然后配置Hive环境变量。可以参考Hive的官方文档进行安装和配置。 2.安装Sqoop,配置Sqoop环境变量 需要下载并安装Sqoop,然后配置Sqoop环境变量。可以参考Sqoop的官方文档进行安装和配置。 3.创建Hive结构 需要先在Hive中创建结构,以便后续将Oracle数据导入到Hive中。可以使用Hive的DDL语句进行创建结构,例如: ``` CREATE TABLE employee ( id INT, name STRING, age INT, gender STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; ``` 4.使用Sqoop将Oracle数据导入到Hive中 使用Sqoop将Oracle数据导入到Hive中,可以使用以下命令: ``` sqoop import \ --connect jdbc:oracle:thin:@//hostname:port/service_name \ --username username \ --password password \ --table oracle_table_name \ --hive-import \ --hive-table hive_table_name \ --fields-terminated-by ',' \ --lines-terminated-by '\n' ``` 其中,`--connect`指定Oracle数据库的连接信息,`--username`和`--password`指定Oracle数据库的用户名和密码,`--table`指定要导入的Oracle名,`--hive-import`指定要将数据导入到Hive中,`--hive-table`指定要导入到的Hive名,`--fields-terminated-by`指定Oracle中字段之间的分隔符,`--lines-terminated-by`指定Oracle中行之间的分隔符。 例如,如果要将Oracle数据库中的`employee`导入到Hive中的`employee`中,可以使用以下命令: ``` sqoop import \ --connect jdbc:oracle:thin:@//localhost:1521/orcl \ --username scott \ --password tiger \ --table employee \ --hive-import \ --hive-table employee \ --fields-terminated-by ',' \ --lines-terminated-by '\n' ``` 这样就可以将Oracle数据成功导入到Hive中了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值