1.文件是什么?
文件是存储在外部介质上的数据或信息集合,程序中源程序、数据中保存的数据、图像中的像素数据等等;
文件是有序的数据序列;
2.编码:
信息从一种形式转换为另一种形式的过程;ascII码、Unicode、utf-8等等;
二进制文件ascII码:照片、音乐、视频、计算机程序。。。
3.文件的基本操作1)打开文件获取文件对象
建立磁盘上的文件与源程序中的对象相关联,程序上叫打开文件,一旦文件被打开,文件的内容就可以通过相关的文件对象获得;
python中处理文件首先要创建一个文件对象与磁盘上的文件相关联,
open(),通常open方法可以立即分配一个文件对象变量:创建一个文件对象
open(磁盘文件名,打开方式)
eg:打开一个名为1.dat的文件:
- >>>infile = open(“1.dat”,”r”) #打开一个文件对象放在infile中
- >>>infile = open(“1.mp3”,”rb”)
接下来就可以用文件指针来读取磁盘上1.dat文件的内容了
2)读取文件--文件操作:就是对open创建的文件对象进行操作
读取:即将文件数据读入计算机内存;
写入:即从计算机内存向文件写入数据;
定位:即定位文件读写位置;
其他:追加、计算等;
关闭文件:完成文件操作后需要关闭文件就是:切断文件与程序的联系,将文件缓冲区的数据写入到磁盘,并释放文件缓冲区。
注意:当写入信息到文件对象时,只有在文件关闭后磁盘上的文件才会显示变化。
例子:读整个文件全部内容
- def main():
- fname = input("enter filename:") #首先提示用户输入文件名
- infile = open(fname,"r")#打开文件并赋值给文件对象变量infile
- data = infile.read()#文件的全部内容被读入在一个长字符串中并存储在data变量中
- print(data)#输出data在屏幕上
- main()
例子:返回文件中5行数据
- #连续调用readline()可以的到文件中连续行,readline()返回值都以换行符结束
- #输出文件前5行:
- def main():
- infile=open("file_name","r")
- for i in range(5):
- line = infile.readline()
- print(line[:1])
- #利用剪切操作去掉每行读入的分隔符,如果输出语句末尾有换行符,
- #输出操作就会自动跳到下一行,这样输出的文件内容各行之间就会多出一个空行
- main()
- >>> outfile = open("outfile.txt","w")
- #打开一个文件并进行文件写入操作,需要一个文件接受数据,如果给出的文件名不存在则会创建一个新文件,如果给出的文件名存在,python将原文件删除并创建一个新的空文件
- >>> outfile.writelines(["hello","","liyue"])
- >>> outfile.close()
- >>> infile = open("outfile.txt","r")
- >>> infile.read()
- 'hello liyue'
文件遍历:是最常见的文件处理方法,例如copy文件、根据数据文件定义行走路径、将文件由一种编码转换成另外一种编码;
通用代码框架:(遍历文件模板:)
- file = open(filename,”r”)
- for each_line in file.readlines():#当文件很大会占用很大内存
- #处理一行文件内容
- file.close()
简化代码框架:
- file = open (filename,”r”)
- for each_line in file:
- #处理一行文件内容
- file.close()
举例:文件拷贝
- def main():
- #用户输入文件名
- f1 = input("输入一个源文件:").strip()
- f2 = input("输入一个源文件:").strip()
- #打开文件
- infile = open(f1,"r")
- outfile = open(f2,"w")
- #copy数据
- countLines = countChars = 0
- for line in infile:
- countLines +=1
- countChars +=len(line)
- outfile.write(line)
- print(countLines,"linesand",countChars,"char copied")
- infile.close()
- outfile.close()
- main()