dataframe数据查询

最新推荐文章于 2024-06-07 22:05:21 发布

繁梦溪

最新推荐文章于 2024-06-07 22:05:21 发布

阅读量1.1k

点赞数 1

分类专栏： Python 文章标签： python pandas

本文链接：https://blog.csdn.net/fg24151110876/article/details/120973574

版权

Python 专栏收录该内容

26 篇文章 5 订阅

订阅专栏

该博客主要展示了如何使用Python的pandas库读取Excel数据，并通过正则表达式进行筛选。首先，它定义了数据类型并读取Excel文件，然后将所有数据转换为字符串类型。接着，运用正则表达式对特定表格名和源类型进行筛选。最后，通过应用函数对数据框的每一行进行匹配检查，并保留符合条件的行。

摘要由CSDN通过智能技术生成

import pandas as pd
# df=pd.read_excel(r'C:\TEMP\后结构化新连接20210915.xlsx',header=0,skiprows=1,index_col='序号')

# dtype = {'column_name' : str})
df=pd.read_excel(r'C:\TEMP\xxxxxx.xlsx',header=0,skiprows=1,index_col='序号',dtype = {'结果表区分字段' : str} )

df=df.astype('str') # 所有数据转换为 str

table='MR_ANALYSIS_DIAGNOSIS'
source_type='1'
df.query("当前保存结果表==@table & 结果表区分字段==@source_type")

正则筛选

import re
table='MR_ANALYSIS_DIAGNOSIS'
# pattern=re.compile(table,re.I)
source_type='1'
def 筛选(table,string):
    return True if re.search(table,string,re.I) else False
df.apply(lambda x:筛选(table,x['当前保存结果表']),axis=1)

import re
table='MR_ANALYSIS_DIAGNOSIS'
pattern=re.compile(table,re.I)
source_type='1'
df.apply(lambda x:True if re.search(table,x['当前保存结果表'],re.I) else False,axis=1)
# df.apply(lambda x:True if pattern.search(x['当前保存结果表']) else False,axis=1)

df.loc[(df.apply(lambda x:True if pattern.search(x['当前保存结果表']) else False,axis=1))]

繁梦溪

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录