使用Pandas对Excel数据进行条件匹配和提取

一、导入所需的库

python代码
import pandas as pd # 用于数据处理和分析
from datetime import datetime # 用于日期时间处理
import json # 用于JSON数据解析

二、读取Excel文件

python代码
# 读取Excel文件
df = pd.read_excel('ufilename.xlsx')

三、定义匹配条件

python代码
# 定义匹配条件,匹配'ucol'列中包含特定值的行,即值是'aa'、'bb'、'cc'的行
match_condition = df['ucol'].isin(['aa','bb',....,'cc'])

四、提取匹配行的其他列值

python代码
# 提取匹配行的其他列值,包括'ucol2'、'ucol3'、'ucol4'和'pd.ucol5'列
matched_values = df[match_condition][['ucol2','ucol3', 'ucol4','pd.ucol5']]

五、业务逻辑处理

# 对之前提取的列的进行业务处理

#-----------------------------------eg

# 对attach列标准化,去除末尾的'}',,具体视情况定,,可删

matched_values['attach'] = matched_values['attach'].str[:-1]  

# 将字符串中的'\'去除

matched_values['attach'] = matched_values['attach'].str.replace("\\", "")

六、将提取的值存入新的Excel文件中(可选)
如果您希望将提取的值保存到新的Excel文件中,可以使用to_excel方法:

python代码
matched_values.to_excel('finalExcel.xlsx')
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值