编码格式
- Python的解释器使用的编码格式是
Unicode
(内存) .py
文件在磁盘上使用UTF-8
存储(外存)
UTF-8
是Unicode
的实现。
不同编码格式,文件占用空间不同。
文件读写的原理
- 文件的读写俗称"IO操作"(input-output)
- 文件读写操作的流程
文件的读取操作
内置函数open()
创建文件对象
语法规则:file = open(filename [, mode, encoding])
file
:被创建的文件对象open
:创建文件对象的函数filename
:创建/打开的文件名称mode
:打开文件的模式,默认为只读encoding
:编码格式;默认文本文件中字符的编码格式为gbk
示例:
- 创建test.txt文件,文件编码格式为GBK
-
创建demo.py文件,写入代码并运行
file = open('test.txt', 'r') # r表示只读 print(file.readlines()) # ['明月几时有\n', '把酒问青天'];返回列表 file.close()
常见的文件类型
按照文件中数据的组织形式,文件分为两大类:
- 文本文件:存储的是普通“字符”文本,默认为Unicode字符集,可用记事本打开
- 二进制文件:把数据内容用“字节”进行存储,无法用记事本打开,必须使用专门的软件,例如:mp3音频文件、jpg图片、doc文档等。