clickhouse批量更新

500万条数据,使用ALERT UPDATE 做更新总是出现各种问题,循环更新处理特别慢。

下面是建一张新表,通过插入的方式去实现更新的目的。

from clickhouse_driver import Client
import re
from tqdm import tqdm

def extract_spname_without_parentheses(spname):
    # 使用正则表达式匹配括号内容并去除
    pattern = re.compile(r'(.+?)\s*(.*)')
    match = re.match(pattern, spname)

    if match:
        return match.group(1)
    else:
        return spname

# ClickHouse 服务器地址和端口
host = 'xxx.xxx.xxx.xxx'
port = '9000'

# 数据库名称
database = 'default'

# 数据库用户名和密码
user = 'xxxx'  # 替换为你的用户名
password = 'xxxx'  # 替换为你的密码

# 创建连接
client = Client(host=host, port=port, database=database, user=user, password=password)

# 查询总数
query = "SELECT count(*) FROM school_score_plan_bak2"  # 替换为你的表名
count = client.execute(query)
total_count = count[0][0]

# 批量插入大小
batch_size = 10000

# 执行查询和批量插入
with tqdm(total=total_count) as pbar:
    offset = 0
    while offset < total_count:
        query = f"SELECT * FROM school_score_plan_bak2 ORDER BY id ASC LIMIT {batch_size} OFFSET {offset}"  # 替换为你的表名
        results = client.execute(query)
        batch_insert_data = []
        for result in results:
            result_list = list(result)
            spname = result_list[22].replace("'", "")
            result_list[22] = spname
            spn = extract_spname_without_parentheses(spname)
            result_list[26] = spn
            batch_insert_data.append(tuple(result_list))
            pbar.update(1)
        # 执行批量插入
        if batch_insert_data:
            insert_query = "INSERT INTO `default`.school_score_plan (id, first_km, `length`, level2_name, local_batch_name, local_type_name, name, num, province_name, school_id, sg_fxk, sg_info, sg_name, sg_sxk, sg_type, sp_fxk, sp_info, sp_sxk, sp_type, sp_xuanke, spcode, special_group, spname, tuition, `year`, local_province_id, spn) VALUES"
            insert_query += ",".join(["{}".format(result) for result in batch_insert_data])
            client.execute(insert_query)
        offset += batch_size

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值