作者 | python与数据分析
来源 | 杰哥的IT之旅
很多做开发、数据库相关工作的小伙伴可能经常会用到 MySQL 的存储过程、定时器、触发器这些高级功能,但是做数据分析或者数据处理,我们也需要掌握这些技能,来解决特定的业务问题。比如:做自动化报表,如果数据需要每天实时更新(增量爬虫)、定时计算某个业务指标 、想要实时监控数据库表中的数据增、删、改情况等。
文章大纲
一、存储过程
1、啥是存储过程,有什么用?
过程 :将若干条 SQL 语句封装起来,起个名字
存储过程 : 我们将此过程存储在数据库中,有点类似于编程中用到的函数,区别是函数有返回值,而过程没有返回值,相同点是将代码封装可复用,可传参,调用即可执行。
好处:① 代码封装可复用 ② 可以接收、返回参数 ③ 减少网络交互、提升效率
2、存储过程如何使用
创建
create procedure 名称()
begin
sql语句;
end
查看
show procedure status;
调用
call 名称();
删除
drop procedure if exists 名称;
3、存储过程中的变量
变量的种类和定义
在 SQL 中变量分为两种:
① 系统变量:@@
② 自定义变量:@
存储过程是可以编程的,意味着可以使用变量、表达式、控制结构,在存储过程中,声明变量用 declare。
格式:declare 变量名 变量类型 【default 默认值】
变量运算与控制结构
变量的赋值,有两种方式:
① set 变量名 = 值
② set 变量名 := 值
if | else 控制结构语法格式
if 条件1 then
sql 语句;
else if 条件2 then
sql 语句;
else
sql语句;
end if
存储过程中的参数传递
为了让存储过程更加灵活,可以传递参数,参数分为三种:
① in:参数作为输入,调用时传入
② out:参数作为输出,可以作为返回值
③ inout:参数即可传入又可输入
格式: in|out|inout 参数名 参数类型
存储过程中使用循环
while 循环格式:
while 条件 do
sql 语句;
end while
打印 1 - 100 之和
带输入参数n,求1-n之和
要求带输入参数 n,和输出参数 total ,求1-n 之和
要求 age 既是输入又是输出变量,传入一个年龄,就增加 20
二、定时器
1、啥是定时器,怎么用?
所谓定时器,就是定时地去运行指定的函数和代码,MySQL 的定时器就是 MySQL 的事件。
在开发过程中经常会遇到这样一个问题:每天或每月需定时去执行一条 SQL 语句或更新或删除数据。在我不了解 MySQL 定时器时,是用 Python 程序代码去操作数据表,再将 Python 程序,放到服务器跑定时任务。现在用定时器,完全可以在数据层面操作了,非常方便。
语法结构
create event [if not exists] 事件名
[definer = user] 可选参数。执⾏事件的⽤⼾,不指定默认就是当前⽤⼾
on schedule 定时时间设置。定义事件执⾏的频率,可以指定具体时间也可以周期性执行
[on completion [not] preserve ] 可选参数。默认是not,表⽰时间过期后会⽴即删除(注意不是不激活);on completion preserve 表⽰时间过期后会继续保留
[enable | disable | disable on slave] 可选参数。默认enable。事件激活、不激活、从服务上不激活(事件在主服务商创建并赋值到从服务器上,仅在主服务上执行)
[comment "注释"] 可选参数。
do 事件内容 定义事件的sql语句,如果语句有多⾏需要⽤ begin end 括起来
指定时间定时执行
at子句:这里要求是timestamp时间格式,⼀般格式是“时间点 + interval 时间单位”。表示在什么时间节点执行,例如:current_timestamp + interval 2 minute
要求:两分钟后往 event_test 表插⼊⼀条语句"事件启动了"
注意:因为参数默认是 on completion not preserve,事件运行完成后会自动删除
周期时间定时执行:
every子句:格式是“数字+时间单位”,表示时间周期,例如:1 hour / 2 minute / 3 second
starts子句:可选,跟上 timestamp 值,表示事件开始的时间点,如果没有指定就是当前时间
ends子句:可选,跟上 timesatamp 值,表示停止执行的时间,如果没有ends表示无限执行
要求:新建数据表 event_test,每分钟往里面插⼊⼀条数据,到 5 分钟结束
注意事项
1、需要激活事件,事件才会被执行,show events才可以查看。⼀个是全局参数开启,⼀个是事件的开启
SET GLOBAL event_scheduler = 1;
设置事件的状态为 enable:
ALTER EVENT event_name ON COMPLETION PRESERVE ENABLE; 开启
ALTER EVENT event_name ON COMPLETION PRESERVE DISABLE; 关闭
2、关掉了 navicat,事件不会关闭,关闭了 MySQL 服务器才会被关闭
3、多语句执行的时候,可能需要修改结束分隔符,比如:delimiter $
4、如果事件的开始时间已经过去了,虽然创建语句不会报错,但是事件不会被创建以及执行
5、事件⾥⾯不能嵌套事件,但是存储过程里面可以使用事件
6、在事件中使用 select、show 等返回结果语句没有意义,但是可以用 select into、insert into 等存储结果的语句
7、注意不要短周期内重复事件调度,不然数据会有问题。例如每分钟执行 100w 行数据,那这个会有问题,如果实在是需要那这个时候可以使用行锁、表锁来进行
8、事件⽆法传递参数,但是可以用事件里面的参数使用存储过程
定时器可以结合存储过程
现在用定时器,就可以在数据层面操作,定时去执行sql 语句或一组 sql 语句(存储过程),设置好定时任务,可通过 navicat —— 其它——事件,查看到当前事件的定义,计划,当然也可以手动完成上述操作。
三、触发器
1、啥是触发器,应用场景是?
触发器是一类特殊的事务,可以监视数据操作(数据表的变更日志),包括 insert | update | delete,并触发相关操作 insert | update | delete,运用触发器,不仅能简化程序,又可以增加程序的灵活性。
应用场景①:当向一张表中添加或删除数据时,需要在相关表中进行同步操作,比如:当一个订单产生时,订单所购的产品的库存量相应减少。
应用场景②:当表中某列数据的值与其他表中的数据有联系时,比如:某客户进行欠款消费,可以在生成订单时,设计触发器判断该用户的累计欠款是否超过最大限度。
应用场景③:跟踪某张表时,比如当有新订单产生时,需通知相关人员进行处理,这时可以在订单表中添加触发器加以实现。
2、触发器如何使用
创建
触发器只支持行级触发(每一行受影响,触发器都执行,叫作行级触发器),不支持语句级触发。
Create trigger 触发器名称
before/after
insert/update/delete
on 表名 for each row #行级触发器
Begin
trigger_state;
end
查看
Show triggers;
删除
Drop trigger 数据库.触发器名称;
要求:现有商品表 goods,订单表 orders,当下一个订单时,商品要相应减少(买几个商品,就少几个库存), 分析如下:
监视谁:orders
监视动作:insert
触发时间:after
触发事件:update
CREATE TABLE goods(gid INT,name VARCHAR(10),num SMALLINT);
CREATE TABLE ord(oid INT ,gid INT, buy_num SMALLINT)
INSERT INTO goods VALUES (1,'cat',20),(2,'dog',90),(3,'pig',26);
查看商品表
创建触发器并查看
发现这样写触发器并不灵活
3、触发器引用行变量
使用别名 old、new 来引用触发器中发生变化的记录内容。注意:
引用行变量
要求:删除一个订单时,商品要退回,库存量要还原(删)
要求:订单表中的数量3 要求改到2,并且让商品表的库存量也变化(改)
要求:假如现在剩余 26 只pig,但是客户下订单买27只,能否预防,能否将buy_num > num 时,将buy_num 自动改为 num(深入理解before 和after的区别)
上面跟大家介绍了,如何数据分析工作中,应用 MySQL 的存储过程、定时器、触发器来实现自动化更新数据。当然,用 Python 或其他编程语言也能实现,个人认为在数据层面操作,更加简单、高效、稳定。具体还要看你当下的业务场景。希望通过本文能为你提供一个解决问题的思路。
往期回顾
分享
点收藏
点点赞
点在看