import pandas as pd
#读取csv文件
pid = pd.read_csv(r'C:\Users\Administrator\Desktop\pid.csv')
#正则匹配('网页'指列名为网页的列)
pid_type=pid['网页'].str.extract(r'(?<=pid=)(.+?)(?=/)')
#合并列
pid = pd.concat([pid,pid_type],axis = 1)
#修改列名
pid.columns=['网页','pid']
#输出成Excel文件
pid.to_excel(r'C:\Users\Administrator\Desktop\pid.xlsx')
使用Python Pandas 笔记(正则匹配输出一串数据中需要的部分)
最新推荐文章于 2024-06-27 15:42:52 发布