1mysql迁移数据至postgrepsql
推荐阿里工具 mysql2pgsql,项目地址https://help.aliyun.com/document_detail/35458.htmlmysql2pgsql
工具 mysql2pgsql 支持不落地的把 MYSQL 中的表迁移到 HybridDB/Greenplum Database/PostgreSQL/PPAS。此工具的原理是,同时连接源端 mysql 数据库和目的端数据库,从 mysql 库中通过查询得到要导出的数据,然后通过 COPY 命令导入到目的端。此工具支持多线程导入(每个工作线程负责导入一部分数据库表)。
参数配置
修改配置文件 my.cfg、配置源和目的库连接信息。
源库 mysql 的连接信息如下:
注意:源库 mysql 的连接信息中,用户需要有对所有用户表的读权限。
host = "127.0.0.1"
port = "3307"
user = "root"
password = "ESBecs00!@#"
db = "devops"
encodingdir = "share"
encoding = "utf8"
binlogfile = "mysql-bin.000001"
binlogfile_offset = "4"
serverid = 13307
目的库 pgsql (包括 Postgresql、PPAS 和 HybridDB )的连接信息如下:
注意:目的库 pgsql 的连接信息,用户需要对目标表有写的权限。
connect_string = "host=127.0.0.1 dbname=exampledb port=5432 user=testpg password=testpg"
target_schema = "public"
ignore_copy_error_count_each_table = "0"
mysql2pgsql 用法
mysql2pgsql 的用法如下所示:
./mysql2pgsql -l -d -n -j <number of threads> -s <schema of target able>
参数说明:
-l:可选参数,指定一个文本文件,文件中含有需要同步的表;如果不指定此参数,则同步配置文件中指定数据库下的所有表。为一个文件名,里面含有需要同步的表集合以及表上查询的条件,其内容格式示例如下:
table2 :
table3
table4: select column1, column2 from tableX where column1 != 10
table5: select * from table_big where column1 >= '2016-08-05
-d:可选参数,表示只生成目的表的建表 DDL 语句,不实际进行数据同步。
-n:可选参数,需要与-d一起使用,指定在 DDL 语句中不包含表分区定义。
-j:可选参数,指定使用多少线程进行数据同步;如果不指定此参数,会使用 5 个线程并发。
-s:可选参数,指定目标表的schema,一次命令只能指定一个schema。如果不指定此参数,则数据会导入到public下的表。
典型用法
全库迁移
全库迁移的操作步骤如下所示:
通过如下命令,获取目的端对应表的 DDL。
./mysql2pgsql -d
根据这些 DDL,再加入 distribution key 等信息,在目的端创建表。
执行如下命令,同步所有表:
./mysql2pgsql
此命令会把配置文件中所指定数据库中的所有 mysql 表数据迁移到目的端。过程中使用 5 个线程(即缺省线程数为 5),读取和导入所有涉及的表数据。
部分表迁移
编辑一个新文件 tab_list.txt,放入如下内容:
t2 : select * from t2 where c1 > 138888
执行如下命令,同步指定的 t1 和 t2 表(注意 t2 表只迁移符合 c1 > 138888 条件的数据):
付网盘下载链接:
http://pan.baidu.com/s/1i5NxlLb
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29096438/viewspace-2138179/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/29096438/viewspace-2138179/