1、检查文件路径是否存在,如果不存在就创建此路径。
#如果不存在路径,就创建一个这样的路径
if not os.path.exists(exp_path):
os.mkdir(exp_path)
os.path.exists():判断括号里的文件是否存在的意思,括号内的可以是文件路径.如果存在就返回True,不存在返回False
os.mkdir():创建路径
2、对文件夹下面的文件名称进行列表排列
file_list = os.listdir(dir_path)
3、过滤不符合要求的文件
filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表
filter(function, iterable)
- function -- 判断函数。
- iterable -- 可迭代对象
def is_odd(n): return n % 2 == 1 newlist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) print(newlist)
[1, 3, 5, 7, 9]
4、用于将元组转换为列表
list()
^(* ̄(oo) ̄)^
元组与列表是非常类似的,区别在于元组的元素值不能修改。
元组是放在括号中,列表是放于方括号中
5、打开文件codeces,open()
查阅资料后和实验后,发现和open()的功能差不多,但在进行爬虫或者其他方式得到数据写入文件时会有编码不统一的问题,所以就一般都统一转换为Unicode编码。
总之,用codeces,open()更便捷点。
6、readlines()
每次按行读取整个文件内容,将读取到的内容放到一个列表中,返回list类型
7、strip()
每次按行读取整个文件内容,将读取到的内容放到一个列表中,返回list类型