TXT
1、读取TXT文件
with open('File.txt', 标识符) as f:print(f.read())
标识包括:r——文本文件;rb——二进制文件
读取函数有:read()、readlines()、readline()
read():一次读取整个文件,直接将所有文件的内容都放到一个字符串变量中。如果文件大于可用内存,为了保险起见,可以反复调用read(size)方法,每次读取size个字节的内容。
readlines():以行的方式读取整个文件,每行会作为一个List的元素,可通过迭代访问每行的内容
readline():每次只读一行,需要用迭代方式读完整个文件,通常比前两个方式慢得多。很少用
注意:
①这三种方式都会把每行末尾的'\n'给读取进来,需要我们手动去掉。
with open('File.txt' , 'r') as f1:
list=f1.readlines()for i inrange(0,len(list)):
list[i]=list[i].rstrip('\n')
str.rstrip(ch):去除字符串末尾的字符ch,缺省时为去除空格
②读取文件不存在时,会产生IOError
2、写文件
写文件与读文件类似,唯一的区别在于调用open()函数时,传入标识符为'w'或者'wb'表示写文本文件和二进制文件
with open ( 'File.txt' , 'w') as f:
f.write('Hello , world!')
写入文件不存在也不会出现IOError,而是会自动生成一个新文件。
写入函数:write()、writelines()
write():与read()、readline()方法对应,直接将一段字符串写入文件中
writelines():与readlines()方法对应,针对List。它接收一个字符串List作为参数,将它们写入到文件中,换行符不会自动加入,需要显式加入换行符
with open('File.txt' , 'w') as f:
f.writelines(['1' , '2' , '3'])#此时File.txt的内容为:123
with open('File.txt' , 'w') as f:
f.writelines( ['1\n' , '2\n' , '3\n'])#此时File.txt的内容为:#1#2#3
3、标识符
'r':读
'w':写
'a':追加(区别于w的覆盖),文件不存在时创建
'r+':可读可写,文件不存在时报错IOError
'w+':可读可写,文件不存在时创建
'a+':可读可追加,文件不存在时创建
以上只针对文本文件,如果是二进制文件,只需都加一个b即可:
'rb'、'wb'、'ab'、'rb+'、'wb+'、'ab+'
4、文件指针偏移
f.seek(offset , whence=0)
该方法用于在文件中移动文件指针。offset表示偏移量。可选参数whence表示从哪里开始偏移,默认是0为文件开头,1为当前位置,2为文件尾部。举例:
with open ( 'File.txt' , 'a+') as f :print(f.read())
f.write('1')
f.seek(0,0)#把文件指针从末尾移动到开头,没有这句话下面的read()就读不到正确的东西
print(f.reaad())
写文件后,如果还要用到读文件,就要用到该方法。
注意:该偏移方法只是作用于'r',对'w'和'a'不起作用——'w'永远是从开头(覆盖)写;'a'永远是从最后追加。
5、编码
要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,例如:读取GBK编码的文件
with open('File.txt','r',encoding='gbk') as f :print(f.read())
而遇到有些编码不规范的文件,可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。这种情况下,open()函数还接收一个errors参数,表示遇到错误后的处理方法。最简单的方式是直接忽略:
with open('File.txt' , 'r' , encoding='gbk' , errors='ignore')
如果读写包含中文文本的txt文件出现无法读取中文的情况,尝试不设置encoding参数
Excel
三种方式:
1、xlrd和xlwt;
2、openpyxl;
3、pandas
建立一个Data.xlsx文件,第一个工作表sheet1区域"A1 : E5"的内容如下,用于测试读Excel的代码:
xlrd与xlwt && openpyxl