1、解压datax包
2、具体安装测试datax工具可以在网上进行查询。其对jdk python maven 都有版本的要求。需确认当前系统中的版本。datax安装以及测试方式
3、确认安装无误后,在安装目录下,或者安装目录的bin目录下新建一个json文件,文件名称自定义。新建的json文件格式(datax bin目录下执行python datax.py -r mysqlreader -w musqlwriter 命令可得到json文件的模板)
4、impala 导入输入到mongo 样例
{
"job": {
"content": [
{
//数据来源
"reader": {
"name": "hdfsreader",
"parameter": {
"path": "/user/hive/warehouse/***.db/***/*", // impala 数据库内存储的数据文件,最后的/* 表示将读取该目录下的所有文件,此处如果未修改库内文件的读写权限会报错。