MySQL大批量Update优化

最新推荐文章于 2024-07-30 11:11:13 发布

Loganer

最新推荐文章于 2024-07-30 11:11:13 发布

阅读量1.1w

点赞数

分类专栏：数据库 Python

本文链接：https://blog.csdn.net/wyh1618/article/details/123214352

版权

数据库批量更新性能优化 Python 临时表

关键词由CSDN通过智能技术生成

Python 同时被 2 个专栏收录

51 篇文章 0 订阅

订阅专栏

数据库

22 篇文章 1 订阅

订阅专栏

参考文章

https://www.cnblogs.com/dasn/articles/6094887.html

需求:

根据一系列规则把文件分为几类，方便查询。
这里使数据库中表结构冗余几列字段来匹配相应的规则，就是需要一条条去扫数据库中的数据，扫完把数据更新回数据库。
问题出在大规模数据的更新上，数据量很大会很耗时。
这里二十多万条数据若是逐条更新需要7/8分钟左右，把需要更新的数据插入到临时表再以表为单位进行更新操作就只需要1/2秒，性能提升还是十分明显的。

代码:

def truncate_patch_insert(_sql_util, sql_insert, list_mesh_all, table_name):
    delete_table_sql = "truncate table %s" % table_name
    _sql_util.update_data(delete_table_sql)
    for i in range(0, len(list_mesh_all), 1000):
        try:
            num = 1000 + i
            if num > len(list_mesh_all):
                _sql_util.insert_many_data(sql_insert, list_mesh_all[i: len(list_mesh_all)])
            else:
                _sql_util.insert_many_data(sql_insert, list_mesh_all[i: i + 1000])
        except Exception as err:
            logger.error("insert %s error =%s", (table_name, err))
            _sql_util.rollback()
            _sql_util.db_close()


def make_label_pss(_sql_util, file_all, pss_name):
    list_all = []
    for file_single in file_all:
        file_name = file_single[1].lower()
        short_name = os.path.basename(file_name)
        sub_type = 0
        for k in constPss:
            if file_name.startswith(k):
                sub_type = constPss[k]
                for st in sub_type:
                    (k, v), = st.items()
                    if short_name.find(k) > 0:
                        sub_type = v
                        break
                    sub_type = v
                break
        # print(type(file_single[0]))
        list_all.append([file_single[0], sub_type])

    sql_insert = """INSERT INTO PssTemp ( id, SubType ) VALUES (%s, %s)"""
    truncate_patch_insert(sql_util, sql_insert, list_all, "PssTemp")
    sql_table_update = """UPDATE %s as t1, PssTemp SET t1.SubType=PssTemp.SubType WHERE t1.id=PssTemp.id""" % pss_name
    sql_util.update_data(sql_table_update)


def scan_table(sql_util, mesh_table_name="", pss_table_name=""):
    list_mesh_all = []

    sql_select_pss = """select id, FileName from %s""" % pss_table_name

    res_mesh_pss = sql_util.select_all_data(sql_select_pss)

    make_label_pss(sql_util, res_mesh_pss, pss_table_name)