目录
前言
本章主要讲述针对多个 excel 文件的数据处理。
一、文件读取
1、通过 pandas库 直接读取本地 指定路径下的 excel 文件
import pandas as pd
# 读取本地指定路径下的文件信息
address = 'D:\PycharmProjects\excelCheck_demo\demo1.xlsx'
excel = pd.read_excel(sla_file_address)
2、读取本地路径下的所有文件,并通过筛选,找到指定文件信息
方法一:
os 库:获取文件/目录
re 库:通过正则表达式进行匹配 re.search
import os
import re
filename = "SLArefundOrder"
# 读取指定目录下的所有文件和目录名
path = r'D:\PycharmProjects\excelCheck_demo'
file = os.listdir(path)
print(file)
# 获取文件路径
item = [i for i in file if re.search(filename, i)]
item_path = os.path.join(path, item[0])
print(item_path)
方法二:
获得符合条件的所有文件路径
import os
result = []
def search(path=".", name=""):
for item in os.listdir(path):
item_path = os.path.join(path, item)
if name in item:
global result
result.append(item_path + ";")
print(item_path + ";")
if __name__ == '__main__':
search(path=r"D:\PycharmProjects\excelCheck_demo", name="SLArefundOrder")
3、本地目录下找到指定文件
# 需要查找的文件名
filename = "SLAPayOrder"
# 指定目录下的所有文件和目录名
dirname = r'D:\PycharmProjects\excelCheck_demo'
address = os.listdir(dirname)
# 获取文件路径,找到符合条件的文件,并打印地址(匹配唯一)
item = [i for i in address if re.search(filename, i)]