python可以处理什么文件_Python文件处理

第1章 简单文件操作

介绍

大多数程序都遵循着:输入->处理->输出的模型,首先接收输入数据,然后按照要求进行处理,最后输出数据。

在编写代码时,操作系统为了更快响应,把所有当前的数据都放在内存中,因为内存和CPU数据传输的速度要比在硬盘和CPU之间传输的速度快很多倍。但是内存有一个天生的不足,就是一旦断电就是什么都没了,所以要保持随时使用Ctrl+S永久保存数据。

Windows是以扩展名来指出文件是什么类型,所以*.exe是可执行文件,*.txt是文本文件,*.docs或*.doc是word的专用格式,这些都称之为文件。

一、打开文件

在Python中,使用open()这个函数来打开文件并返回文件对象。

1、操作文件的流程:

#1、打开文件,得到文件句柄并赋值给一个变量

f=open(r'a.txt','r',encoding='utf-8')#2、通过句柄对文件进行操作

data=f.read()print(data)#3、关闭文件

f.close() #文件关闭,回收操作系统的资源

2、打开文件不需要close()的方法

with open(r'a.txt','r',encoding='utf-8') as f:print(f.read())

二、文件的打开模式

43ea587ac9c205345a3dcc54673368af.png

#1. 打开文件的模式有(默认为文本模式):

r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】

w,只写模式【不可读;不存在则创建;存在则清空内容】

a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】#2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)

rb

wb

ab

注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码#3. 了解部分

"+"表示可以同时读写某个文件

r+, 读写【可读,可写】

w+,写读【可读,可写】

a+, 写读【可读,可写】

x, 只写模式【不可读;不存在则创建,存在则报错】

x+,写读【可读,可写】

xb

三、操作文件的方法

d1874c8f6698e83ccf5fdea1e1b5584b.png

文本读模式

8f900a89c6347c561fdf2122f13be562.png

961ddebeb323a10fe0623af514929fc1.png

#读操作:r只读模式,默认是rt

f=open('a.txt','r',encoding='utf-8')

data1=f.read()print('=1===>',data1)

data2=f.read()print('=2===>',data2)

f.close()

执行结果:=1===>哈哈哈哈

你好lionel=2===>

#readline和readlines

f=open(r'a.txt','r',encoding='utf-8')print(f.readline(),end='')print(f.readlines())

f.close()

执行结果:

哈哈哈哈

['你好lionel']#文本读模式:循环文件#while循环

with open(r'a.txt','r',encoding='utf-8') as f:whileTrue:

line=f.readline()if len(line) == 0:break

print(line,end='')#for循环

with open(r'a.txt','r',encoding='utf-8') as f:for line inf:print(line,end='')

View Code

文本写模式

8f900a89c6347c561fdf2122f13be562.png

961ddebeb323a10fe0623af514929fc1.png

#写操作:w只写模式,默认是wt文本写,如果文件不存在则创建,存在则清空+覆盖

f=open(r'a.txt','w',encoding='utf-8')

f.write('11111\n')

f.write('222222\n')

f.writelines(['嘻嘻嘻\n','你好','wang'])

f.close()

执行结果:

a.txt 文件已经被覆盖,下面是a.txt文件内容:11111

222222嘻嘻嘻

你好wang

View Code

文本追加模式

8f900a89c6347c561fdf2122f13be562.png

961ddebeb323a10fe0623af514929fc1.png

f=open(r'a.txt','a',encoding='utf-8')

f.write('12312312\n')

f.writelines(['wangzhiwei\n','123456\n'])

f.write('cccccccccccc')

f.close()

执行结果:

a.txt文件内容:11111

222222嘻嘻嘻

你好wang12312312wangzhiwei123456cccccccccccc

View Code

四、文件的修改

文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:

方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)

importos

with open('info.txt','r',encoding='utf-8') as read_f,open('.info.txt.swap','w',encoding='utf-8') as write_f:

data=read_f.read() #全部读入内存,如果文件很大,会很卡

write_f.write(data.replace('alex','SB')) #在内存中完成修改,并一次性写入新文件

os.remove('info.txt')

os.rename('.info.txt.swap','info.txt')

方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件

importos

with open('info.txt','r',encoding='utf-8') as read_f,\

open('.info.txt.swap','w',encoding='utf-8') as write_f:#data=read_f.read()

#write_f.write(data.replace('alex','SB'))

for line inread_f:if 'SB' inline:

line=line.replace('SB','alex')

write_f.write(line)

os.remove('info.txt')

os.rename('.info.txt.swap','info.txt')

五、文件内光标移动

1、read(3):

a、文件打开方式为文本模式时,代表读取3个字符

b、文件打开方式为b模式时,代表读取3个字节

2、 其余的文件内光标移动都是以字节为单位如seek,tell,truncate

注意:

1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的

2. truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果

六、练习

#利用b模式,编写一个cp工具,要求如下:

#1. 既可以拷贝文本又可以拷贝视频,图片等文件

#2. 用户一旦参数错误,打印命令的正确使用方法,如usage: cp source_file target_file

#方法一:

importsysif len(sys.argv) != 3:print('usage: cp source_file target_file')

sys.exit()

_,srcfile,dstfile,*_=sys.argv

with open(srcfile,'rb') as read_f,\

open(dstfile,'wb') as write_f:for line inread_f:

write_f.write(line)#方法二:

importsysif len(sys.argv) != 3:print('usage: cp source_file target_file')

sys.exit()

source_file,target_file=sys.argv[1],sys.argv[2]

with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:for line inread_f:

write_f.write(line)#基于seek实现tail -f功能

importtime

with open('access.log','rb') as f:

f.seek(0,2)whileTrue:

line=f.readline()ifline:print(line.decode('utf-8'),end='')else:

time.sleep(0.05)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值