import openpyxl
import re
# 加载 Excel 文件
workbook = openpyxl.load_workbook('example.xlsx')
sheet = workbook.active
# 获取需要处理的列
source_column = sheet['A']
# 定义输出列
year_column = []
name_column = []
# 循环遍历每个单元格
for cell in source_column:
# 提取年份和名称
year = cell.value[:4] # 利用字符串切片提取前四个字符
name = cell.value[5:] # 利用字符串切片去除开头的年份和横杠
# 去除姓名中的括号及其内容
real_name = re.search(r'^([^((]+)', name).group(1)
# 存储到列表中
year_column.append(year)
name_column.append(real_name)
# 写入到对应的列中
for i in range(len(year_column)):
sheet.cell(row=i+1, column=1, value=year_column[i])
sheet.cell(row=i+1, column=2, value=name_column[i])
# 保存文件
output_file = 'output.xlsx'
workbook.save(output_file)