一、导入所需的库
python代码
import pandas as pd # 用于数据处理和分析 | |
from datetime import datetime # 用于日期时间处理 | |
import json # 用于JSON数据解析 |
二、读取Excel文件
python代码
# 读取Excel文件 | |
df = pd.read_excel('ufilename.xlsx') |
三、定义匹配条件
python代码
# 定义匹配条件,匹配'ucol'列中包含特定值的行,即值是'aa'、'bb'、'cc'的行 | |
match_condition = df['ucol'].isin(['aa','bb',....,'cc']) |
四、提取匹配行的其他列值
python代码
# 提取匹配行的其他列值,包括'ucol2'、'ucol3'、'ucol4'和'pd.ucol5'列 | |
matched_values = df[match_condition][['ucol2','ucol3', 'ucol4','pd.ucol5']] |
五、业务逻辑处理
# 对之前提取的列的进行业务处理
#-----------------------------------eg
# 对attach列标准化,去除末尾的'}',,具体视情况定,,可删
matched_values['attach'] = matched_values['attach'].str[:-1]
# 将字符串中的'\'去除
matched_values['attach'] = matched_values['attach'].str.replace("\\", "")
六、将提取的值存入新的Excel文件中(可选)
如果您希望将提取的值保存到新的Excel文件中,可以使用to_excel
方法:
python代码
matched_values.to_excel('finalExcel.xlsx') |