2022年6月15日Python课堂笔记:文件和异常处理

本文介绍了文件的类型,包括文本文件和二进制文件,强调了文件对象在处理文件时的重要性。详细讲解了如何使用内置的`open()`函数打开和关闭文件,特别是文件编码和模式参数的使用。此外,还提及了一个作业,要求解析拉勾网数据文件并提取关键信息,如岗位名称、城市、薪资等,最终保存为CSV格式。
摘要由CSDN通过智能技术生成

文件是保存于存储介质中的数据集合,按存储格式可将文件分为文本文件和二进制文件。Python使用文件对象来读写文件,文件对象根据读写模式决定如何读取文件数据。

文件

文件是操作系统管理和存储数据的一种方式,Python使用文件对象来处理文件。

文件类型

通常,文件可分为文本文件二进制文件Python根据打开模式按文本文件或二进制文件格式读写文件中的数据。

  • 文本文件根据字符编码保存文本,常见字符编码如ASCII(默认编码)UTF-8(所有国家用的编码)GB2312等;文本文件按字符读取文件,一个字符占用一个或多个字节;文本文件常用于保存字符组成的文本,整个文件可看作一个长字符串。
  • 二进制文件存储的是数据的二进制代码(位0和位1),即将数据在内存中的存储形式复制到文件中;二进制文件没有字符编码,文件的存储格式与用途无关,二进制文件通常用于保存图片音频和视频等数据。图片、音频和视频有不同的编码格式,如png格式的图片、mp3格式的音频、mp4格式的视频等;二进制文件通常按字节读取文件。

打开和关闭文件

使用Python内置的open()函数来打开文件,并返回其关联的文件对象,基本语法如下:

myfile = open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)  # 打开文件

注意:其中 filemodeencoding 这 3 个参数比较重要

  • file 文件名,文件名可以是相对路径,也可以是绝对路径,省略路径时,Python在当前工作目录中搜索文件
  • encoding 文件编码,比如GBKUTF-8UTF-8-sig等,有时候打开的文件会乱码,就需要使用这个参数处理
  • mode 文件模式,默认是r,即读模式

模式

解释

模式

解释

r

只读方式打开文件,默认模式

b

二进制读写模式

w

新建一个文件用于写入,如果文件已经存在则会覆盖旧文件

t

按文本格式读写文件数据,默认方式

a

追加模式,打开一个文件用于追加,如果该文件不存在则创建新文件

+

组合读写模式,同时进行读、写操作

x

创建新文件,如果文件存在则报错

1.第一步:使用程序打开一个文件hello.txt,调用函数写入三行文本,hello    hello  world     hello  python

 第二步:读取写入的内容到内存中进行替换,把 hello 换成 你好写入到另一个文件  hi.txt 

 

 写一个程序把D:\WorkSpace\Cenos-7-x86_64-DVD-1810.iso   复制到

D:\WorkSpace\pythonProject

 作业:

# 解析拉勾网数据文件,提取所需数据维度信息
# 岗位名称    positionName
# 城市        city
# 薪资范围    salary
# 福利待遇    companyLabelList
# 技能要求    skillLables
# 学历要求    education
# 工作经验    workYear

保存 CSV 格式 ,

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值