文件的类型
文本文件:包含纯文本内容,例如.txt、.doc、.docx、.pdf等格式的文件。
图像文件:包含图像或照片的文件,例如.jpg、.png、.gif、.bmp等格式的文件。
音频文件:包含音频数据的文件,例如.mp3、.wav、.aac、.flac等格式的文件。
视频文件:包含视频数据的文件,例如.mp4、.avi、.mov、.mkv等格式的文件。
电子表格文件:包含表格数据的文件,例如.xlsx、.csv、.ods等格式的文件。
压缩文件:将一个或多个文件和文件夹压缩成一个文件的格式,例如.zip、.rar、.tar.gz等格式的文件。
可执行文件:包含计算机程序代码的文件,例如.exe、.app、.sh等格式的文件。
数据库文件:包含结构化数据的文件,例如.db、.sql等格式的文件。
源代码文件:包含编程源代码的文件,例如.java、.py、.cpp、.html等格式的文件。
电子邮件文件:包含电子邮件消息的文件,例如.eml、.msg等格式的文件。
文本文件(Text File):文本文件包含的是纯文本数据,使用的是字符编码(例如ASCII、UTF-8等)来表示字符。文本文件以可读的形式存储文本内容,可以用文本编辑器打开并查看或编辑其中的文本。常见的文本文件格式包括.txt、.doc、.docx、.csv等。
二进制文件(Binary File):二进制文件包含的是非文本数据,它们以字节流的形式存储,其中的数据并不直接对应于可读的字符。二进制文件可以包含各种数据类型,例如图像、音频、视频、执行代码等。由于其非文本性质,二进制文件通常不能直接以文本编辑器打开或编辑,而是需要相应的程序或工具来读取和处理。常见的二进制文件格式包括.jpg、.mp3、.mp4、.exe等。
总结来说,文本文件是以可读形式存储文本数据的文件,而二进制文件包含非文本数据,并以字节流的形式存储。文本文件可以直接用文本编辑器打开和编辑,而二进制文件需要相应的程序或工具来解析和处理其中的数据。
# 逐行读取文件内容
with open('file.txt', mode='r') as f:
for line in f:
print(line)
# 一次性读取所有内容
with open('file.txt', mode='r') as f:
content = f.read()
print(content)
# 一次性读取所有行,并返回一个列表
with open('file.txt', mode='r') as f:
lines = f.readlines()
print(lines)
# 例子中使用了 open() 函数打开了文件,使用 with 语句操作文件,自动在处理结束后关闭文件。
# f.read()与f.readlines()都是将内容一次性读入内容,如果内容过大会导致内存溢出,若还想将内容全读入内存,则必须分多次读入,有两种实现方式:
# 方法一
with open('a.txt',mode='rt',encoding='utf-8') as f:
for line in f:
print(line) # 同一时刻只读入一行内容到内存中
# 方式二
with open('1.mp4',mode='rb') as f:
while True:
data=f.read(1024) # 同一时刻只读入1024个Bytes到内存中
if len(data) == 0:
break
print(data)