sqlbalance4mysql使用_MySQL中特别实用的几种SQL语句送给大家

在写SQL时,经常灵活运用一些SQL语句编写的技巧,可以大大简化程序逻辑。减少程序与数据库的交互次数,有利于数据库高可用性,同时也能显得你的SQL很牛B,让同事们眼前一亮。

目录

高能预警,这是一篇干货满满的MySQL技术文章,总有一天,你必然会用到,记得收藏! -- 来自一位被技术经理毒打多年的程序员的忠告

130e1eb5f8f1b6220c54315c3e448d1d.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

实用的SQL

1.插入或替换

如果我们想插入一条新记录(INSERT),但如果记录已经存在,就先删除原记录,再插入新记录。

情景示例:这张表存的每个客户最近一次交易订单信息,要求保证单个用户数据不重复录入,且执行效率最高,与数据库交互最少,支撑数据库的高可用。

此时,可以使用"REPLACE INTO"语句,这样就不必先查询,再决定是否先删除再插入。

"REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。

"REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。

"REPLACE INTO"语句是基于唯一索引或主键来判断唯一(是否存在)的。

注意事项:如下SQL所示,需要在username字段上建立唯一索引(Unique),transId设置自增即可。

-- 20点充值

REPLACE INTO last_transaction (transId,username,amount,trans_time,remark)

VALUES (null, 'chenhaha', 30, '2020-06-11 20:00:20', '会员充值');

-- 21点买皮肤

REPLACE INTO last_transaction (transId,username,amount,trans_time,remark)

VALUES (null, 'chenhaha', 100, '2020-06-11 21:00:00', '购买盲僧至高之拳皮肤');

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

若username='chenhaha'的记录不存在,REPLACE语句将插入新记录(首次充值),否则,当前username='chenhaha'的记录将被删除,然后再插入新记录。

id不要给具体值,不然会影响SQL执行,业务有特殊需求除外。

2.插入或更新

如果我们希望插入一条新记录(INSERT),但如果记录已经存在,就更新该记录,此时,可以使用"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句:

情景示例:这张表存了用户历史充值金额,如果第一次充值就新增一条数据,如果该用户充值过就累加历史充值金额,需要保证单个用户数据不重复录入。

这时可以使用"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句。

注意事项:同上,"INSERT INTO ... ON DUPLICATE KEY UPDATE ..."语句是基于唯一索引或主键来判断唯一(是否存在)的。如下SQL所示,需要在username字段上建立唯一索引(Unique),transId设置自增即可。

-- 用户陈哈哈充值了30元买会员

INSERT INTO total_transaction (t_transId,username,total_amount,last_transTime,last_remark)

VALUES (null, 'chenhaha', 30, '2020-06-11 20:00:20', '充会员')

ON DUPLICATE KEY UPDATE  total_amount=total_amount + 30, last_transTime='2020-06-11 20:00:20', last_remark ='充会员';

-- 用户陈哈哈充值了100元买瞎子至高之拳皮肤

INSERT INTO total_transaction (t_transId,username,total_amount,last_transTime,last_remark)

VALUES (null, 'chenhaha', 100, '2020-06-11 20:00:20', '购买盲僧至高之拳皮肤')

ON DUPLICATE KEY UPDATE total_amount=total_amount + 100, last_transTime='2020-06-11 21:00:00', last_remark ='购买盲僧至高之拳皮肤';

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

若username='chenhaha'的记录不存在,INSERT语句将插入新记录,否则,当前username='chenhaha'的记录将被更新,更新的字段由UPDATE指定。

3.插入或忽略

如果我们希望插入一条新记录(INSERT),但如果记录已经存在,就啥事也不干直接忽略,此时,可以使用INSERT IGNORE INTO ...语句:情景很多,不再举例赘述。

注意事项:同上,"INSERT IGNORE INTO ..."语句是基于唯一索引或主键来判断唯一(是否存在)的,需要在username字段上建立唯一索引(Unique),transId设置自增即可。

-- 用户首次添加

INSERT IGNORE INTO users_info (id, username, sex, age ,balance, create_time)

VALUES (null, 'chenhaha', '男', 12, 0, '2020-06-11 20:00:20');

-- 二次添加,直接忽略

INSERT IGNORE INTO users_info (id, username, sex, age ,balance, create_time)

VALUES (null, 'chenhaha', '男', 12, 0, '2020-06-11 21:00:20');

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

若username='chenhaha'的记录不存在,INSERT语句将插入新记录,否则,不执行任何操作。

4.SQL中的if-else判断语句

众所周知,if-else判断在任何地方都很有用,在SQL语句中,"CASE WHEN ... THEN ... ELSE ... END"语句可以用在增删改查各类语句中。

给个情景:妇女节大回馈,2020年注册的新用户,所有成年女性账号送10元红包,其他用户送5元红包,自动充值。

示例语句如下:

-- 送红包语句

UPDATE users_info u

SET u.balance = CASE WHEN u.sex ='女' and u.age > 18 THEN u.balance + 10

ELSE u.balance + 5 end

WHERE u.create_time >= '2020-01-01'

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

情景2:有个学生高考分数表,需要将等级列出来,650分以上是重点大学,600-650是一本,500-600分是二本,400-500是三本,400以下大专;

原测试数据如下:

e7b2c1c8890c508ec8f1f7631e393303.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

查询语句:

SELECT *,case when total_score >= 650  THEN '重点大学'

when total_score >= 600 and total_score <650 THEN '一本'

when total_score >= 500 and total_score <600 THEN '二本'

when total_score >= 400 and total_score <500 THEN '三本'

else '大专' end as status_student

from student_score;

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

e4e4098e80edd3a37aacfe7e35265f43.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

5.指定数据快照或备份

如果想要对一个表进行快照,即复制一份当前表的数据到一个新表,可以结合CREATE TABLE和SELECT:

-- 对class_id=1(一班)的记录进行快照,并存储为新表students_of_class1:

CREATE TABLE students_of_class1 SELECT * FROM student WHERE class_id=1;

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

新创建的表结构和SELECT使用的表结构完全一致。

6.写入查询结果集

如果查询结果集需要写入到表中,可以结合INSERT和SELECT,将SELECT语句的结果集直接插入到指定表中。

例如,创建一个统计成绩的表statistics,记录各班的平均成绩:

CREATE TABLE statistics (

id BIGINT NOT NULL AUTO_INCREMENT,

class_id BIGINT NOT NULL,

average DOUBLE NOT NULL,

PRIMARY KEY (id)

);

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

然后,我们就可以用一条语句写入各班的平均成绩:

INSERT INTO statistics (class_id, average) SELECT class_id, AVG(score) FROM students GROUP BY class_id;

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

确保INSERT语句的列和SELECT语句的列能一一对应,就可以在statistics表中直接保存查询的结果:

SELECT * FROM statistics;

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

+----+----------+--------------+

| id | class_id | average      |

+----+----------+--------------+

|  1 |        1 |        475.5 |

|  2 |        2 | 473.33333333 |

|  3 |        3 | 488.66666666 |

+----+----------+--------------+

3 rows in set (0.00 sec)

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

7.强制使用指定索引

在查询的时候,数据库系统会自动分析查询语句,并选择一个最合适的索引。但是很多时候,数据库系统的查询优化器并不一定总是能使用最优索引。如果我们知道如何选择索引,可以使用FORCE INDEX强制查询使用指定的索引。例如:

SELECT * FROM students FORCE INDEX (idx_class_id) WHERE class_id = 1 ORDER BY id DESC;

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

指定索引的前提是索引idx_class_id必须存在。

心得体会:

记得那一年,我还是个孩子,记得第一个需求是做个统计接口,查询近两小时每隔5分钟为一时间段的网站访问量,JSONArray中一共返回24个值,当时菜啊,写了个接口循环二十四遍,发送24条SQL去查(捂脸),由于那个接口,被技术经理嘲讽~~表示他写的SQL比我吃的米都多。虽然我们山东人基本不吃米饭,但我还是羞愧不已。。

然后经理通过调用一个dateTime函数分组查询处理一下,就ok了,效率是我的几十倍吧。从那时起,我就定下目标,深入MySQL学习,日后争取嘲讽回去~~~

筒子们,MySQL路漫漫,其修远兮。永远不要眼高手低,一起加油,希望本文能对你有所帮助。

------------------------------------------------------------- 华丽的分割线 ---------------------------------------------------------

(续)评论区问题反馈

这一周有好几个朋友在评论区评论或私信我,问我当年那条SQL是咋写的,经理是咋写的。。看大家对知识的热情这么高,我必须得开源一下了,在这贴出来当时的SQL。有个点声明,项目数据库在内网不好测试,我就模拟了一张表来给大家统计一下吧。

需求回顾:时间就'2020-01-14 00:00:00' - '2020-01-15 00:00:00' 为准,统计当天以每10分钟为间隔的分组数据。

@当年经理的SQL

其中时间根据需求自行修改,由于我只生成了一天的测试数据,我就以此为例。

SELECT DATE_FORMAT(p.createTime, '%H') as date_str,count(*) as count

from data_timing p

where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')

AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')

GROUP BY HOUR(p.createTime)

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

经理这条SQL查询的结果如下,基本保留了当年原版~~这条的意思是取“2020-01-14”这天24小时每小时的count。当时我很有启发,也很有感觉,发现SQL还能这么玩儿。完事儿写完他说就要撤了,说要去接孩子。我说:“大佬,咱别吃饭吃一半儿啊,再给我来一下子呗”。

235fd46ae263beefb62097b611c657b6.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

@修改后最终版SQL

然后经过我后续修改SQL如下:

SELECT concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) /10 )*10 ) as date_str

, count(*) as count from data_timing p

where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')

AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')

GROUP BY concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) /10 ))

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

乍一看是不是还挺复杂,并不是多复杂,只是其中几个函数内容比较多。。比如concat()里的那一堆,以及date_format那些。先看结果吧。后面跟各位说一下查询原理:

8753df119ec63714dda2dd061b36bf2d.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

@最终版SQL原理

如上所述,是每隔10分钟为一个时间段,当时只能想到了以每分钟为时间段分组的SQL,如下。

SELECT concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' ) )) as date_str

, count(*) as count from data_timing p

where DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') < DATE_FORMAT('2020-01-15 00:00:00', '%Y-%m-%d %H:%i:%S')

AND DATE_FORMAT(p.createTime, '%Y-%m-%d %H:%i:%S') >= DATE_FORMAT('2020-01-14 00:00:00', '%Y-%m-%d %H:%i:%S')

GROUP BY MINUTE(p.createTime)

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

查询结果:

403fc2463dbb32d358e09b637d9c4d4b.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

那我怎么以10分钟为单位呢??网上各种查,网上虚的太多。也没有找到真正有用的写法,这不是坑爹吗,后来我想了想。想到了个好主意,每10分钟的特征在于“yyyy-MM-dd HH:m”这里,如果我将“10分钟”级为单位的字符串切分出来,不管“1分钟”级的。不就能分组匹配了么,哎呀我tm真是有点佩服我自己。

d2fe9e8d4635d84e06f6090bfaf3fb5d.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

因此,按每分钟分组的SQL和上面按10分钟分组的SQL不同之处就在这里:

group by concat( date_format( p.createTime, '%Y-%m-%d %H:' ) , floor( date_format( p.createTime, '%i' )/10) )

我将分钟'%i'除以10然后向下取整,再进行group by 分组,最后展示的时候我可以在处理一下加“*10”用于展示,当然,也可以不用“*10”,结果如下,有点畸形,看着难受,但不妨碍使用。

5526c72797657f2233a781ec1a587c45.png

wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==

好了,答应各位的已经搞定啦。有细心的小伙伴会发现,咦,你这数据中,如果没查到为0的怎么不显示呢?比如凌晨1点多的,都没有显示。这样岂不是还得后台处理补全?这个问题留给大家,如果有好的方法可以在评论区留言,我会随时关注老铁们的动态的~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值