Python循环遍历读取多个csv文件

这段代码展示了如何利用Python的os和pandas库来遍历指定目录下的所有CSV文件,并使用正则表达式筛选出.csv文件进行读取。通过on_bad_lines='skip'参数,可以跳过读取过程中遇到的错误行,确保数据处理的稳定性。
摘要由CSDN通过智能技术生成

Python循环遍历读取多个csv文件

# os模块提供了非常丰富的方法用来处理文件和目录
# re模块使python语言拥有全部的正则表达式功能
import os
import pandas as pd
import re
path = r"./data/"  # 读取csv文件目录路径
# listdir()--返回path指定 的 文件夹中包含的文件或者文件夹名字 的 列表
FileNames = os.listdir(path)# 因此Filename是一个列表
for fn in FileNames:
    # re.search(pattern, string, flags=0) 扫描整个字符串并返回第一个成功的匹配
    # pattern:匹配的正则表达式
    # string:要匹配的字符串
    # flags:表达式,用于控制正则表达式的匹配方式
    if re.search(r'\.csv$', fn):
        fullfilename = os.path.join(path, fn)
        df = pd.read_csv(fullfilename,encoding='utf-8',on_bad_lines='skip')
        print(fn)  # 文件名
        print(df)  # 数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值