不同的数据源更新同一个table中的不同字段,所以我们需要设计一种方案以实现上述目标。比如我们有如下表格:
CREATE TABLE `company_info` (
`id` int(10) NOT NULL,
`company_name` varchar(60) DEFAULT NULL,
`address` varchar(200) DEFAULT NULL,
`legal_person` varchar(48) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
我们现在有2个数据源,分别提供id、company_name、address和id、legal_person的信息,最后这2部分数据汇总到一起形成一条完整的数据。
最开始我们使用repalce into进行数据插入,结果发现上述两部分数据(分别记数据流A和数据流B)入库到表格中是互斥的,要不是数据流A中的数据要不是数据流B中的数据。细查replace into的作用:1、首先判断数据是否存在;2、如果不存在,则插入;3、如果存在,则更新。上述中的更新指的整条数据的更新而不是一条数据中字段的更新。它的运作方式是:先判断一条数据是否存在,如果存在则删除之前的老数据然后插入新数据,如果不存在则插入一条新数据。
实验1:通过replace into插入一条新数据:replace into company_info(id, legal_person) values(2, "马云"); 执行这条语句影响行数为1。
实验2:通过replace into替换一条老数据:replace into company_info(id, legal_person) values(1, "马云"); 执行这条语句影响行数为2。
那么该怎么实现两个数据流汇总到一条数据中的需求呢?我们通过insert into xx(yyy) values(zz) on duplicate key update a=values(a),b=values(c)... 的语法可以达到预期的目标。上述语法的运作方式是:插入一条数据,如果主键冲突的话则更新相关字段。于是我们可以通过以下两条sql语句实现company_info表格的数据汇拢。
insert into company_info(id,company_name,address) values(1, "华为技术有限公司", "深圳龙岗区")
ON DUPLICATE KEY
UPDATE id=VALUES(id),company_name=values(company_name),address=values(address);
insert into company_info(id,legal_person) values(1, "任正非")
ON DUPLICATE KEY
UPDATE id=VALUES(id),legal_person=values(legal_person);