Python正则表达式删除中文汉字（非英文）中间的空格_python 正则表达式,去掉中文之间的空格-CSDN博客

本文链接：https://blog.csdn.net/LionAndBears/article/details/107025068

背景

网络上一些文本里可能有不必要的空格，如果是中英文混杂的文本，需要删除汉字中间的空格，保留英文中间的空格，在Python里可以用re包来实现。

简体中文正则表达式[\u4e00-\u9fa5]（不含标点符号）
空格正则表达式\s(等同于[\r\t\v\n])
需要保留的内容放在括号里，后续用\1\2指代第1个括号和第2个括号里的内容

代码

原文： Hey Jane, 周末要不要一起吃早茶，叫上Jennie。

import re
x = 'Hey Jane, 周 末 要 不要一起	吃早茶，叫上Jennie。'
space_patten = re.compile(r'([\u4e00-\u9fa5])\s+([\u4e00-\u9fa5])')
x = space_patten.sub(r'\1\2', x)
print(x)
# Hey Jane, 周末 要不要一起吃早茶，叫上Jennie。
x = space_patten.sub(r'\1\2', x)
print(x)
# Hey Jane, 周末要不要一起吃早茶，叫上Jennie。