文件
文件的概念
文件的概念和作用
- 计算机中的文件,就是存储在某种长期存储设备上的一段数据
- 长期存储设备包括:硬盘、U盘、移动硬盘、光盘 ···
文件的作用
将数据长期保存下来,在需要的时候使用
文件的存储方式
- 在计算机中,以2进制的方式保存在磁盘上
文本和二进制文件
- 文本文件
- 可以使用文本编辑器查看
- 本质上还是二进制文件
- 二进制文件
- 保存的文件需要提供专业软件打开
- 图像文件、音频文件、视频文件
- 不能使用文本编辑器查看
python操作文件
使用python操作文件的套路非常固定,一共包含3个步骤
- 打开文件
- 读、写文件
- 读 将文件写入内存
- 写 将内存内容写入文件
- 关闭文件
操作文件的函数/方法
- 在python中,要操作文件需要1个函数和3个方法
序号 | 函数/方法 | 说明 |
---|---|---|
1 | open | 打开文件并返回文件的对象 |
2 | read | 将文件写入内存 |
3 | write | 将内存内容写入文件 |
4 | close | 关闭文件 |
- open 函数负责打开文件,并返回文件对象
- read/write/close 三个方法都需要通过文件方法调用
read 方法 --读取文件
open
函数的第一个参数,是要打开的文件名- 如果文件存在,返回文件操作对象
- 如果文件不存在,抛出异常
read
方法可以一次性读取并返回文件的所有内容close
方法负责关闭文件- 如果忘记关闭文件,会消耗系统资源,并影响下次对文件的访问
- 方法执行后,会将文件指针移动到文件的末尾
file = None
try:
file = open("README")
text = file.read()
print(text)
except Exception as result:
print(result)
finally:
file.close()
文件指针
- 文件指针标记从哪个位置开始读取文件
- 第一次打开文件时,通常文件指针会指向文件的开始位置
- 当执行了
read
方法后,文件指针会移动到文件的末尾- 默认情况下移动到文件末尾
打开文件的方式
file = open("文件路径+文件名",mode = "访问方式")
- open 函数默认以只读方式打开
序号 | 访问方式 | 说明 |
---|---|---|
1 | r | 以只读方式打开,文件的指针位于文件开始位置,如果文件不存在会抛出异常 |
2 | w | 以只写方式打开文件,如果文件存在会被覆盖,如果文件不存在,创建新文件 |
3 | a | 以追加的方式打开文件,文件指针位于文件末尾,如果文件不存在,创建新的文件 |
4 | r+ | 以读写的方式打开,文件指针位于文件开头,如果文件不存在,抛出异常 |
5 | w+ | 以读写的方式打开,文件指针位于文件开头,如果文件不存在,创建新的文件 |
6 | a+ | 以读写的方式打开文件,文件指针位于文件末尾,如果文件不存在,创建新的文件 |
- 频繁移动文件指针,会影响文件的读写效率。
按行读取
readline
方法,,可以一次性读取一行文件- 方法执行后,会将文件指针置于下一行,准备再次读取
file = None
try:
file = open("README",
mode='r',
encoding='UTF-8')
while True:
text = file.readline()
if not text:
break
print(text)
except Exception as result:
print(result)
finally:
file.close()
文件复制
小文件整体复制
file = None
file2 = None
try:
file = open("README",
mode='r',
encoding='UTF-8')
file2 = open("README2",
mode='w',
encoding='UTF-8')
text = file.read()
file2.write(text)
except Exception as result:
print(result)
finally:
file.close()
file2.close()
大文件逐行复制
file = None
file2 = None
try:
file = open("README",
mode='r',
encoding='UTF-8')
file2 = open("README4",
mode='w',
encoding='UTF-8')
while True:
text_line = file.readline()
if not text_line:
break
file2.write(text_line)
except Exception as result:
print(result)
finally:
file.close()
file2.close()
文件/目录的常用管理操作
导入os模块,实现对文件/目录的管理操作
文件操作
序号 | 操作 | 说明 |
---|---|---|
1 | os.rename(源文件名,目标文件名) | 重命名一个文件 |
2 | os.remove(文件名) | 删除文件 |
目录操作
序号 | 操作 | 说明 |
---|---|---|
1 | os.listdir(目录名) | 目录列表 |
2 | os.mkdir(目录名) | 创建目录 |
3 | os.rmdir(目录名) | 删除目录 |
4 | os.getcwd() | 获取当前目录 |
5 | os.chdir(目录名) | 修改工作目录 |
6 | os.path.isdir(目录名) | 判断是否为目录 |
ASCII编码和UNICODE编码
- 计算机只有
256
个ASCII
字符 - 一个ASCII字符占用
1
个 字节 (8个bit) - 使用1~6个字节表示一个
utf-8
字符 - 大多数汉字占用
3
个字符 utf-8
是UNICODE
编码方式
python2.x中如何使用中文
# *_* coding:utf8 *_*
也可以使用
#coding = utf8
- 在
python2.x
中,即使指定了文件使用utf-8
标准,但是在遍历字符串时,仍旧以一个字节为单位遍历字符 - 在字符串前面新增
u
,告诉解释器这是一个unicode
字符串