1、文件概念
- 计算机的文件,就是存储在某种长期存储设备上的一段数据
- 长期存储设备包括:硬盘、U盘、移动硬盘、光盘等
2、文件的作用
- 将数据长期保存下来,以便使用
3、文件的存储方式
在计算机中,文件是以二进制的方式保存在磁盘上的
文件分为文本文件和二进制文件
- 文本文件
- 可以使用文本编辑器软件查看
- 本质上还是二进制文件
- 例如:Python的源程序
- 二进制文件
- 保存的内容不是给人直接阅读的,而是提供给其他软件使用的
- 例如:图片文件、音频文件、视频文件等
4、文件的基本操作
在计算机中,要操作文件的步骤比较固定
- 打开文件
- 读、写文件
- 读 【将文件内容读入内存】
- 写 【将内存内容写入文件】
- 关闭文件
操作文件的函数/方法
在Python中要操作文件,需要记住1个函数和3个方法
函数/方法 | 说明 |
open | 打开文件,并且放回文件操作对象 |
read | 将文件内容读取到内存 |
write | 将指定内容写入文件 |
close | 关闭文件 |
- 其中:
- open
- 函数负责打开文件,并且返回文件对象
- read/write/close
- 三个方法都需要通过文件对象来调用
- open
read【读取文件】
open函数的第一个参数是目标文件名(文件名区分大小写)
- 如果文件存在,返回文件操作对象
- 如果文件不存在,会抛出异常
4.1--read方法--读取文件
。--open函数的第一个参数是要打开的文件名(文件名区分大小写)
--如果文件存在,返回文件操作对象
--如果文件不存在,会抛出异常
。--read方法可以一次性读入并返回文件的所有内容
。--close方法负责关闭文件
--如果忘记关闭文件,会造成系统资源的消耗,而且会影响到后续对文件的访问
**注意:方法执行后,会把文件指针移动到文件的末尾
#打开 - 文件名需要注意大小写
file=open("文件名")
#读取
text=file.read()
print(text)
#关闭
file.close
提示:在开发中,通常会先编写打开和关闭的代码,再编写中间针对文件的读/写操作!
4.2--文件指针
。--文件指针标记从哪个位置开始读取数据
。--第一次打开文件时,通常文件指针会指向文件的开始位置
。--当执行了read方法后,文件指针回移动到读取内容的末尾
--默认情况下会移动到文件末尾
。思考:如果执行了一次read方法后,读取了所有内容,那么在此调用read方法,还能够获得到内容吗?
--不能。
--因为,第一次读取之后,文件指针移动到了文件末尾,再次调用不会读取到任何的内容
4.3--打开文件的方式
。--open函数默认以 只读 方式打开文件,并且返回文件对象
。--语法:
f=open("文件名","访问方式")
访问方式 说明
r 以只读方式打开文件。文件的指针将会放在文件的开头,这是默认模式。如果文件不存在,抛出异常
w 以只写方式打开文件。如果文件存在会被覆盖。如果文件不存在,创建新文件
a 以追加的方式打开文件。如果该文件已经存在,文件指针将会放在文件的结尾。如果文件不存在,创建新文件进行写入
r+ 以读写方式打开文件。文件的指针将会放在文件的开头。如果文件不存在,抛出异常
w+ 以读写方式打开文件。如果文件存在会被覆盖。如果文件不存在,创建新文件
a+ 以读写方式打开文件。如果该文件已经存在,文件指针将会放在文件的结尾。如果文件不存在,创建新文件进行写入
提示:如果以读写的方式打开文件,频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以 只读、只写的方式来操作文件
例:
file=open("abc","w")
file.write("我爱你")
file.close()
4.4--按行读取文件内容
。--read方法默认会把文件的所有内容一次性读取到内存
。--如果文件太大,对内存的占用会非常严重
。--readline方法
--readline方法可以一次读取一行内容(有返回结果)
--方法执行后,会把文件指针移动到下一行,准备再次读取
例:
#打开文件
file=open("文件名")
while Ture:
#读取一行内容
text=file.readline()
#判断是否读到内容
if not text:
break
#没读取一行的末尾已经有了一个‘\n’
print(text,end="")
#关闭文件
file.close()
5.1--小文件复制
。--目标:用代码的方式,来实现文件复制过程
源文件-->目标文件
。--小文件复制
--打开一个已有文件,读取完整内容,并写到另一个文件
file_read=open("文件1")
file_write=open("文件2","w")
text=file_read.read()
file_write.write(text)
file_read.close()
file_write.close()
5.2--大文件复制
。--打开一个已有的文件,逐行读取内容,并顺序写入到另一个文件
file_read=open("文件1")
file_write=open("文件2","w")
while Ture:
text=file_read.read()
#判断是否读入到内容
if not text:
break
file_write.write(text)
file_read.close()
file_write.close()
6--文件/目录的常用管理操作
。--在终端/文件浏览器中,可以执行常规的文件/目录管理操作
--例如:创建、重命名、删除、改变路径、查看目录内容...
。--在Python中,如果希望通过程序实现上述功能,需要导入 os 模块
文件操作:
方法名 说明 示例
rename 重命名文件 os.rename(源文件名.目标文件名)
remove 删除文件 os.remove(文件名)
例:
import os
#将文件名1改为2
os.rename("1.txt","2.txt")
#删除文件
os.remove("2.txt")
目录操作:
方法名 说明 示例
listdir 输出指定目录列表 os.listdir(目录名)
mkdir 创建目录 os.mkdir(目录名)
rmdir 删除目录 os.rmdir(目录名)
getcwd 获取当前目录 os.getcwd()
chdir 修改工作目录 os.chdir(目标目录)
path.isdir 判断是否是文件 os.path.isdir(文件路径)
提示:文件或者目录操作都支持相对路径和绝对路径
例:
import os
#Linux操作系统终端
os.listdir(".")
#判断是否为文件
os.path.isdir("文件名")
#创建文件 文件1
os.mkdir("文件1")
#删除文件 文件1
os.rmdir("文件1")
7--文本文件的编码格式(了解)
。--文本文件存储的内容是基于字符编码的文件,常见的编码由ASCII编码、UNICODE编码等
--Python2.x默认使用ASCII编码
--Python3.x默认使用UTF-8编码
。--ASCII编码
--计算机中只有256个ASCII字符
--一个ASCII在内存中占用1个字节的空间
-8个0或1的排列组合方式一共有256中,也就是2的8次方
。--UTF-8编码格式
--计算机中使用1~6个字节来标识UTF-8字符,涵盖了地球上几乎所有地区的文字
--大多数汉字会使用3个字节表示
--UTF-8是UNICODE编码的一种编码格式
8--Python2.x中如何使用中文
。--在Python2.x文件的第一行,增加以下代码,解释器会以UTF-8编码来处理Python文件
--这是官方推荐使用的 # *-* coding:utf8 *-*
--也可以使用: #coding=utf8
。--Unicode字符串
--在Python2.x中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串
--要能够正确的遍历字符串,在定义字符串时,需要在字符串的引号前,增加一个小写字母 u ,
告诉解释器这是一个Unicode字符串(使用UTF-8编码格式的字符串)