@[TOC](python使用 SSCursor (流式游标) 在循环中执行任务卡住)
最近需要使用python连接mysql数据库,从一个表中循环读取数据,经过处理后存入另一个表。在执行一次循环后,出现没有报错但卡死的问题,查找问题后认为是执行cursor.execute时间过长,导致与数据库的连接断开。
问题
使用 pymysql连接mysql,并且使用使用 SSCursor (流式游标) 解决 Python 使用 pymysql 查询大量数据导致内存使用过高的问题(参考1)
conn = pymysql.connect(host=‘localhost’,user=‘root’,password=‘root’,database=‘xxx’)
cursor = pymysql.cursors.SSCursor(conn)
while True:
row = cursor.fetchone()
“”“数据处理得到需要保存到另一个表的信息”“”
info_list=(tuple)
sql_insert = “”“insert into xxx (a,b,c) values (s%,数量要和前面字段数相等) “””
cursor.execute(sql_insert,info_list)
conn.commit()
在执行过一次之后,代码没有报错,但是一直显示正在运行。修改了SET NET_WRITE_TIMEOUT之后可以继续执行,但得到的row都变成了None
原因
因为 SSCursor 是没有缓存的游标,结果集只要没取完,这个 conn 是不能再处理别的 sql,包括另外生成一个 cursor 也不行的。如果需要干别的,请另外再生成一个连接对象。
每次读取后处理数据要快,不能超过 60 s,否则 mysql 将会断开这次连接,也可以修改 SET NET_WRITE_TIMEOUT = xx 来增加超时间隔。(参考2)
解决步骤
1、创建两个conn
conn1 = pymysql.connect(host=‘localhost’,user=‘root’,password=‘root’,database=‘xxx’,,cursorclass = pymysql.cursors.SSCursor)
cursor1 = conn1.cursors()
conn2 = pymysql.connect(…)
cursor2 = conn2.cursors()
while True:
row = cursor1.fetchone()
“”“数据处理得到需要保存到另一个表的信息”“”
info_list=(tuple)
sql_insert = “”“insert into xxx (a,b,c) values (s%,数量要和前面字段数相等) “””
cursor2.execute(sql_insert,info_list)
conn2.commit()
2、如果从表1提取数据后,计算并将结果存入表2的时间过长,需要设置SET NET_WRITE_TIMEOUT
在mysql中使用命令show global variables like ‘%timeout%’;查看时间相关设置,参数意义见参考3,然后需要把mysql的 net_read_timeout和net_write_timeout设置得大一些。设置的方式有两种:
一种是mysql命令:set global net_write_timeout =;commit;
一种是修改my.ini文件,步骤如下
总结
学习中遇到这个问题,查了很多没有找到相关解决办法(可能还是经验不足,搜索的关键词不对),直到看到参考2的一段话,豁然开朗,现记录问题及解决过程,请大佬们指点。
参考
1,https://blog.csdn.net/weixin_41287692/article/details/83545891
2,https://blog.csdn.net/u011076848/article/details/132055106
3,https://www.jianshu.com/p/5c8bf86f53ef