Mysql集群一：主从复制，通过mysql-proxy做负载均衡。

JC_陈

已于 2023-04-18 22:53:47 修改

阅读量238

点赞数

分类专栏：集群文章标签： lua 运维操作系统

于 2014-05-10 16:19:00 首次发布

本文链接：https://blog.csdn.net/hwp1023/article/details/84598044

版权

mysql集群架构方式很多，根据不同的需求做不一样的架构，简单一点的就是mysql的replication，也就是Mysql的复制功能，模式有：master-slaves，master-slaves-slaves,master-master-slaves等可以有多个分层，那么现在我所要说的是master-slaves的模式（其他的模式原理基本都一样），然后再通过mysql官方提供的Mysql-proxy实现读写分离，达到负载均衡的效果。

Sqoop架构非常简单，其整合了Hive、Hbase和Oozie，通过MapReduce任务来传输数据，从而提供并发特性和容错。利用JDBC标准接口访问数据，所以可以兼容几乎所有的数据库类产品。其架构为：

Sqoop，类似于其他ETL工具，使用元数据模型来判断数据类型并在数据从数据源转移到Hadoop时确保类型安全的数据处理。Sqoop专为大数据批量传输设计，能够分割数据集并创建Hadoop任务来处理每个区块。Sqoop有一个非常小的命令集，里面包括导入和导出，列出数据库和表信息，生成Java类来操纵数据，解析SQL命令以及其他一些更专门的命令。生成Java类的命令对于在Hadoop里编写Java应用来进行数据操作特别有用。SQL解析命令可以显示执行SQL语句的结果，这在搜索新数据库或产生复杂逻辑的查询时非常有用。

Sqoop被设计成具备容错性。你也可以自定义脚本来监控你的工作状态，然后从故障中恢复，但是那有可能难以置信的耗时。

Sqoop中一大亮点就是可以通过hadoop的mapreduce把数据从关系型数据库中导入数据到HDFS。

进行增量导入是与效率有关的最受关注的问题，因为Sqoop专门是为大数据集设计的。Sqoop支持增量更新，将新记录添加到最近一次的导出的数据源上，或者指定上次修改的时间戳。

由于Sqoop将数据移入和移出关系型数据库的能力，其对于Hive—Hadoop生态系统里的著名的类SQL数据仓库—有专门的支持不足为奇。命令“create-hive-table”可以用来将数据表定义导入到Hive。

Sqoop可以在HDFS/Hive/Hbase和关系型数据库之间进行数据的导入导出，其中主要使用了import和export这两个工具。这两个工具非常强大，提供了很多选项帮助我们完成数据的迁移和同步。比如，下面两个潜在的需求：业务数据存放在关系数据库中。

1. 如果数据量达到一定规模后需要对其进行分析或同统计，单纯使用关系数据库可能会成为瓶颈，这时可以将数据从业务数据库数据导入（import）到Hadoop平台进行离线分析。

2. 对大规模的数据在Hadoop平台上进行分析以后，可能需要将结果同步到关系数据库中作为业务的辅助数据，这时候需要将Hadoop平台分析后的数据导出（export）到关系数据库。

环境：

　　主机：master:192.168.1.109，slave1:192.168.1.110，mysqlProxy:192.168.1.112。（workstation10平台创建虚拟机模拟）

　　操作系统：Red Hat Enterprise Linux Server release 5.8

　　mysql：my

最低0.47元/天解锁文章

JC_陈

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Mysql集群一：主从复制，通过mysql-proxy做负载均衡。

mysql集群架构方式很多，根据不同的需求做不一样的架构，简单一点的就是mysql的replication，也就是Mysql的复制功能，模式有：master-slaves，master-slaves-slaves,master-master-slaves等可以有多个分层，那么现在我所要说的是master-slaves的模式（其他的模式原理基本都一样），然后再通过mysql官方提供的Mysql-p...
复制链接

扫一扫