Python文件读写readline()、readlines()、CSV库、pandas库

最新推荐文章于 2023-10-03 11:36:23 发布

Jessica__WEI

最新推荐文章于 2023-10-03 11:36:23 发布

阅读量1w

点赞数 2

分类专栏： python 文章标签： csv

本文链接：https://blog.csdn.net/u013402321/article/details/80277022

版权

python 专栏收录该内容

8 篇文章

订阅专栏

本文介绍了Python中处理文件的几种方法，包括readline()和readlines()的区别，强调了当内存有限时应选择readline()。详细讲解了csv库的reader, writer, DictReader和DictWriter的用法，特别是如何处理分隔符问题。此外，还概述了pandas库的read_csv()和to_csv()函数在CSV文件操作中的应用。最后提到了字符串操作如join, split和strip在处理行内容时的作用。" 121611487,10113640,微积分实践：导数与微分问题解析,"['数学', '微积分', '解析几何']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.readline()

.readline()每次只读取一行，通常比 .readlines()慢得多；仅当没有足够内存可以一次读取整个文件时，才应该使用.readline()。

f = open('poem.txt','r')  
result = list()  
for line in open('poem.txt'):  
    line = f.readline()  
    print line  
    result.append(line)  
print result  
f.close()                  
open('result-readline.txt', 'w').write('%s' % '\n'.join(result))

2. readlines()

.readlines()自动将文件内容分析成一个行的列表，该列表可以由 Python 的 for... in ... 结构进行处理。

f = open('cdays-4-test.txt', 'r')                   #以读方式打开文件  
result = list()  
for line in f.readlines():                          #依次读取每行  
    line = line.strip()                             #去掉每行头尾空白  
    if not len(line) or line.startswith('#'):       #判断是否是空行或注释行  
        continue                                    #是的话，跳过不处理  
    result.append(line)                             #保存  
result.sort()                                       #排序结果  
print result  
open('cdays-4-result.txt', 'w').write('%s' % '\n'.join(result)) #保存入结果文件

3. csv库处理csv文件

csv.reader()
csv.writer()

csv.DictReader() .fieldnames .next() .append()

csv.DictWriter() .writeheader() .writerow()

with open(infile,'rb') as fin:
    dr = csv.DictReader(fin, delimiter='\t')

# dr.fieldnames contains values from first row of `f`.
with open(outfile,'wb') as fou:
    dw = csv.DictWriter(fou, delimiter='\t', fieldnames=dr.fieldnames)

   dw.writerow(dict((fn,fn) for fn in dr.fieldnames))
   for row in dr:
       dw.writerow(row)

csv文件默认是以逗号为分隔符，如果出现错误“ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2”，可以通过设置参数 sep=’\t’ ，即以tab为分隔符写入来处理。

参考：CSV读写csv文件

4. pandas

pandas.read_csv() pandas.read_csv参数详解

pandas.to_csv()

5. 其他

join用于连接字符串，split用于拆分字符串，strip用于去除每行头尾空白。