第六章
一、文件类型
文本类型有文本文件和二进制文件
1.二进制文件和文本文件——两个保存的时候注意编码形式
Windows编码:GBK
Python编码:utf-8(平时编码的时候写中文注释的话都是utf-8)
保存时右下角的编码有不同形式
2.区别:同样存储“12”,作为一个整数占用四个字节,作为文本则只用两个字节(分别储存“1”和“2”)
二、打开,关闭文件
1.打开文件
函数:f = open(文件名,文件使用形式,编码方式,缓冲区大小)
常用的文件使用模式
注:1.操作前一定要先打开文件
2.w是只写方式,会清空已存在文件的内容,w+可以同时读和写
运用w+打开文件
3.一般在路径前补个r——raw“原生”使其不会转意
2.关闭
函数:fw.close()
Python一定要关闭文件才能保存修改,否则未保存时数据一直在缓冲区
改进方法——用with关键字会自动管理资源(即自动关闭)
三、读/写文件和文件定位
1.文本文件
读写文件
函数:read()
read函数运用例子
read和readlines区别:+s会读取文件内所有字符
读写的时候"\n"(换行符)也会视为字符
文件路径中./是unix系统的写法
课程中提到的语法糖格式: s = open("target.py".encoding='utf-8').read()
2.二进制文件
读取与写入二进制文件
写入函数:dump(写入对象,文件对象)
写入对象可以使整数实数字符串列表、字典等对象
读取函数:load(文件对象)
注:load和dump都会自动处理不同数据的边界
3.文件定位
文件指针:表示文件当前读/写位置的变量
函数tell():返回文件指针的当前位置
函数seek():可以把文件指针移动到新位置
格式:1.tell()
2.seek(偏移值,起点)
注:文本文件只支持起点0和正偏移值
四、读/写docx文件和xlsx文件
首先下载两个第三方包python-docx和pyxl
注意:最后一步一定要save文件
1.docx文件
docx文件的操作步骤:
示例的操作步骤
推荐的操作:简写函数名称减少输入量(例如:wb = Workbook())
例:wb=Workbook()
2.xlsx文件
修改单元格:
1.找到对应工作表,方法:ws=wb['工作表名字']
2.修改单元格数据
五、文件与文件夹操作
os模块和os.path都是Python标准库,不用下载
注:1.做文件及文件夹操作时这些文件都应该提前准备好
2.区别绝对路径和相对路径
os模块:(基本的文件文件夹操作)
os.path模块:(路径判断,连接及切分)