dataframe数据查询

该博客主要展示了如何使用Python的pandas库读取Excel数据,并通过正则表达式进行筛选。首先,它定义了数据类型并读取Excel文件,然后将所有数据转换为字符串类型。接着,运用正则表达式对特定表格名和源类型进行筛选。最后,通过应用函数对数据框的每一行进行匹配检查,并保留符合条件的行。
摘要由CSDN通过智能技术生成
import pandas as pd
# df=pd.read_excel(r'C:\TEMP\后结构化新连接20210915.xlsx',header=0,skiprows=1,index_col='序号')

# dtype = {'column_name' : str})
df=pd.read_excel(r'C:\TEMP\xxxxxx.xlsx',header=0,skiprows=1,index_col='序号',dtype = {'结果表区分字段' : str} )

df=df.astype('str') # 所有数据转换为 str
table='MR_ANALYSIS_DIAGNOSIS'
source_type='1'
df.query("当前保存结果表==@table & 结果表区分字段==@source_type")

正则筛选 

import re
table='MR_ANALYSIS_DIAGNOSIS'
# pattern=re.compile(table,re.I)
source_type='1'
def 筛选(table,string):
    return True if re.search(table,string,re.I) else False
df.apply(lambda x:筛选(table,x['当前保存结果表']),axis=1)
import re
table='MR_ANALYSIS_DIAGNOSIS'
pattern=re.compile(table,re.I)
source_type='1'
df.apply(lambda x:True if re.search(table,x['当前保存结果表'],re.I) else False,axis=1)
# df.apply(lambda x:True if pattern.search(x['当前保存结果表']) else False,axis=1)

df.loc[(df.apply(lambda x:True if pattern.search(x['当前保存结果表']) else False,axis=1))]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值