读取文件夹下所有csv文件,获取文件名
分两部分功能代码
1.各种格式均读取
2.只读取csv文件(可以参照修改成只读取其他格式)
1. 文件夹内读取所有各种文件的方法
### 读取文件夹下的所有文件
import os
# 输出文件夹下的所有文件
os.listdir('C:\Users\Administrator\Desktop\测试') 有错误
这里有一个问题,就是对于python对于路径读取的时候unicode有问题。
引起这个错误的原因就是转义的问题。
在windows系统当中读取文件路径可以使用,但是在python字符串中\有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符。
主要有三种方法:
1.在路径前加r,即保持字符原始值的意思。
os.listdir(r'C:\Users\Administrator\Desktop\测试')
2.把反斜杠 \ 替换为双反斜杠 \ \ 。
os.listdir(r'C:\Users\Administrator\Desktop\测试')
3、替换为正斜杠 / 。
os.listdir('C:/Users/Administrator/Desktop/测试')
运行结果:
文件是放在 测试 文件夹下
例如:
C:/Users/Administrator/Desktop/测试/1.txt
2.文件夹内只读取csv文件
以上是文件夹内读取所有各种文件的方法,那么如果文件夹内有多种文件,我只要读取csv文件怎么办呢,或者我要读取特定几种文件。
首先使用os.walk这个函数,这个函数返回的是当前文件夹名称,子文件夹名以及当前文件夹下的所有文件名这三个值,然后每个值都是一个列表的形式
通过for语句循环找出文件名中含有带特定格式后缀的文件,放入filename_list这里面,函数返回这个列表。
为了避免文件名中含有格式名的其他文件混入,如csv.txt,所以应该使用 . csv 来避免这一情况。
代码如下
def get_all_csv_name(path,filetype):
filename_list = []
for folderName, subfolders, filenames in os.walk(path):
for file_name in filenames:
for i in filetype:
if i in file_name :
filename_list.append(file_name)
return filename_list
get_all_csv_name(path=r'C:\Users\Administrator\Desktop\测试',filetype=['.txt','.bmp'])
参考资料:
https://www.jianshu.com/p/762385c824e9