mysql表关联去重_MySQL数据表合并去重的简单实现方法

场景:

爬取的数据生成数据表,结构与另一个主表相同,需要进行合并+去重

解决:(直接举例)

首先创建两个表pep,pep2,其中pep是主表

CREATE TABLE IF NOT EXISTS `pep/pep2`(

`id` INT UNSIGNED AUTO_INCREMENT,

`no` VARCHAR(100) NOT NULL,

PRIMARY KEY ( `id` )

)ENGINE=InnoDB DEFAULT CHARSET=utf8;

然后向pep中插入两条数据,pep2中插入一条与pep中相同的一条数据

insert into pep(no) values('abc');

insert into pep(no) values('caa');

insert into pep2(no) values('abc');

将pep2的数据插入pep中

insert into pep (no) select no from pep2;

分组去重创建新的临时表tmp

create table tmp select id,no from pep group by no;

注意:创建完这个表的id字段类型已经不是主键自增

可能也会报错

```Syntax error or access violation: 1055 Expression #1 of SELECT

list is not in GROUP BY clause and contains nonaggregated

column 'XXX.Y.ZZZZ' which is not functionally dependent on

columns in GROUP BY clause; this is incompatible with

sql_mode=only_full_group_by

```

解决:执行以下两个命令:

```

mysql> set global sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';

mysql> set session sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';

```

删除pep表,并将tmp表重命名为pep

drop table pep;

alter table tmp rename to pep;

查看desc结构和select * from pep发现id的字段类型变了,这里需要改回原来的类型;

alter table pep add primary key (id);

alter table pep modify id int auto_increment;

还有可以使用join来做去重,更快的还可以添加一个字段(可以是几个字段+起来的的md5值),给这个字段创建一个唯一索引unique,以后插入数据的时候,自动回过滤掉重复的数据。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。

### 回答1: 可以使用 `INNER JOIN` 来进行双查询,使用 `DISTINCT` 来去重。示例代码如下: ``` SELECT DISTINCT table1.column1, table1.column2, table2.column1 FROM table1 INNER JOIN table2 ON table1.column1 = table2.column2; ``` 其中,`table1` 和 `table2` 是要进行查询的两张,`column1` 和 `column2` 是两张中相同的列名,用来进行联结,`DISTINCT` 用来去重,可以根据需要选择保留的列名。 ### 回答2: 在 MySQL 中进行双查询并去重可以通过使用 DISTINCT 关键字来实现。双查询是指从两个中同时检索数据的操作。 假设有两个A和B,我们想要对它们进行联合查询并去重。例如,我们想要从A和B中获取所有的客户姓名。首先,我们需要使用 UNION 运算符将两个数据合并在一起。UNION 运算符将从A和B中检索所有的数据,并且将它们合并为一个结果集。然后,我们可以在查询中使用 DISTINCT 来去除重复数据。 以下是一个示例查询的代码: ``` SELECT DISTINCT customer_name FROM ( SELECT customer_name FROM tableA UNION SELECT customer_name FROM tableB ) AS combined_table; ``` 在这个例子中,我们首先在子查询中使用 UNION 运算符将A和B中的客户姓名合并为一个结果集。然后,我们在外部查询中使用 DISTINCT 关键字来去掉重复的客户姓名。最后,我们将结果集中的客户姓名作为查询的结果返回。 注意,用于合并的列必须是相同的数据类型。如果希望除了姓名还能检索其他列的数据,可以在子查询中包含其他需要的列,并相应地进行调整。 总之,通过使用 UNION 和 DISTINCT 关键字,我们可以在 MySQL 中进行双查询并去重。 ### 回答3: 在MySQL中进行双查询并去重可以通过使用DISTINCT关键字来实现。 假设有两个table1和table2,它们通过某个列进行关联。要进行双查询并去重,可以使用如下的SQL语句: SELECT DISTINCT column_name FROM table1 INNER JOIN table2 ON table1.column_name = table2.column_name; 其中,column_name是用来进行关联的列的名称。 以上SQL语句的意思是,首先使用INNER JOIN连接table1和table2两个,连接的条件是两个中的column_name列的值相等。然后使用DISTINCT关键字来去除查询结果中的重复行,最后只返回不重复的column_name列的值。 这样就可以实现简单的双查询并去重的操作了。 需要注意的是,在使用DISTINCT关键字时,只会去除查询结果中所有列的完全相同的重复行。如果查询结果中某些列的值相同,但其他列的值不同,那么这些行依然会保留下来。如果需要去除多个列的重复行,可以在DISTINCT关键字后面指定想要去重的列的名称。 另外,还可以使用其他的方法来进行双查询并去重,比如使用子查询、使用UNION操作符等,具体可以根据实际需求来选择适合的方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值