常规用的是内连接(取交集):
左连接:
通过grop by 和 having 查重去重:
一个表出现多个Id相同的重复数据。使用having外带子查询:
select * from student where Id in (select Id from student group by Id having count(Id) > 1)
同时使用delete删除重复的
DELETE from student WHERE (id) IN (SELECT id FROM student GROUP BY id HAVING COUNT(id) > 1) AND ROWID NOT IN (SELECT MIN(ROWID) FROM student GROUP BY id HAVING COUNT(*) > 1)
解析:rowid是另一个属性值,找到重复行,且去掉rowid最小的一行,把这些剩下的行根据id删除。
这里有一个问题,一个别人的博客(https://www.cnblogs.com/Can-daydayup/p/10454336.html)提到了这是不对的,不能将查到的结果直接去删除,应该先查到的放到一个临时表,再去删除。这里最好的方式是(假设删除name重复,id不重复):
delete from student where ID not in (select MIN(id) from student group by Name);
解析:直接按name分组,并且找出各个组
其中所有的id最小的行,那么不在这个范围里的id就是多余重复的。
count分析:
select count(address) from Student , Student中100条数据,其中60条adress不为空,返回60,结果错。count列时,该列不允许有null,否则就错了。count(primaryKey)效率优于count(*)。
select:
尽量别写select *。1.查询效率降低,数据量传输太大。。2.如果涉及多张表,可能字段相同,影响数据绑定。
insert:
规范写法:insert into student (id,name,address) values ('1', 'Peter', 'Shanghai')
不规范写法:insert into student values ('1', 'Peter', 'Shanghai').
因为首先这样属性对应不明确可读性差,其次修改数据库后这里就很麻烦。
调优细节:
1.查重去重的方法。
2.不用select *,conunt * 时用primaryKey代替