Python学习笔记--文件

1--文件概念

。--计算机的文件,就是存储在某种长期存储设备上的一段数据

。--长期存储设备包括:硬盘、U盘、移动硬盘、光盘等



2--文件的作用

。--将数据长期保存下来,以便使用


3--文件的存储方式

。--在计算机中,文件是以二进制的方式保存在磁盘上的
。--文件分为文本文件和二进制文件

。--文本文件

--可以使用文本编辑器软件查看
--本质上还是二进制文件
--例如:Python的源程序

。--二进制文件

--保存的内容不是给人直接阅读的,而是提供给其他软件使用的
--例如:图片文件、音频文件、视频文件等
--二进制文件不能使用文本编辑软件查看


4--文件的基本操作

。--在计算机中,要操作文件的步骤比较固定

--打开文件
--读、写文件

-读 将文件内容读入内存
-写 将内存内容写入文件

--关闭文件

。--操作文件的函数/方法

--在Python中要操作文件,需要记住1个函数和3个方法

函数/方法 说明

open 打开文件,并且放回文件操作对象
read 将文件内容读取到内存
write 将指定内容写入文件
close 关闭文件

其中:
--open函数负责打开文件,并且返回文件对象
--read/write/close三个方法都需要通过文件对象来调用



4.1--read方法--读取文件

。--open函数的第一个参数是要打开的文件名(文件名区分大小写)

--如果文件存在,返回文件操作对象
--如果文件不存在,会抛出异常

。--read方法可以一次性读入并返回文件的所有内容
。--close方法负责关闭文件
--如果忘记关闭文件,会造成系统资源的消耗,而且会影响到后续对文件的访问
**注意:方法执行后,会把文件指针移动到文件的末尾


#打开 - 文件名需要注意大小写
file=open("文件名")

#读取
text=file.read()
print(text)

#关闭
file.close

提示:在开发中,通常会先编写打开和关闭的代码,再编写中间针对文件的读/写操作!

4.2--文件指针

。--文件指针标记从哪个位置开始读取数据
。--第一次打开文件时,通常文件指针会指向文件的开始位置
。--当执行了read方法后,文件指针回移动到读取内容的末尾
--默认情况下会移动到文件末尾

。思考:如果执行了一次read方法后,读取了所有内容,那么在此调用read方法,还能够获得到内容吗?

--不能。
--因为,第一次读取之后,文件指针移动到了文件末尾,再次调用不会读取到任何的内容

4.3--打开文件的方式

。--open函数默认以 只读 方式打开文件,并且返回文件对象
。--语法:
f=open("文件名","访问方式")

访问方式 说明

r 以只读方式打开文件。文件的指针将会放在文件的开头,这是默认模式。如果文件不存在,抛出异常
w 以只写方式打开文件。如果文件存在会被覆盖。如果文件不存在,创建新文件
a       以追加的方式打开文件。如果该文件已经存在,文件指针将会放在文件的结尾。如果文件不存在,创建新文件进行写入
r+ 以读写方式打开文件。文件的指针将会放在文件的开头。如果文件不存在,抛出异常
w+ 以读写方式打开文件。如果文件存在会被覆盖。如果文件不存在,创建新文件
a+ 以读写方式打开文件。如果该文件已经存在,文件指针将会放在文件的结尾。如果文件不存在,创建新文件进行写入

提示:如果以读写的方式打开文件,频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以 只读、只写的方式来操作文件

例:
file=open("abc","w")
file.write("我爱你")
file.close()

4.4--按行读取文件内容

。--read方法默认会把文件的所有内容一次性读取到内存
。--如果文件太大,对内存的占用会非常严重

。--readline方法

--readline方法可以一次读取一行内容(有返回结果)
--方法执行后,会把文件指针移动到下一行,准备再次读取

例:
#打开文件
file=open("文件名")

while Ture:

#读取一行内容
text=file.readline()

#判断是否读到内容
if not text:
break

#没读取一行的末尾已经有了一个‘\n’
print(text,end="")

#关闭文件
file.close()


5.1--小文件复制

。--目标:用代码的方式,来实现文件复制过程
源文件-->目标文件

。--小文件复制

--打开一个已有文件,读取完整内容,并写到另一个文件

file_read=open("文件1")
file_write=open("文件2","w")

text=file_read.read()
file_write.write(text)

file_read.close()
file_write.close()

5.2--大文件复制

。--打开一个已有的文件,逐行读取内容,并顺序写入到另一个文件

file_read=open("文件1")
file_write=open("文件2","w")

while Ture:

text=file_read.read()

#判断是否读入到内容
if not text:
break

file_write.write(text)


file_read.close()
file_write.close()


6--文件/目录的常用管理操作

。--在终端/文件浏览器中,可以执行常规的文件/目录管理操作
--例如:创建、重命名、删除、改变路径、查看目录内容...
。--在Python中,如果希望通过程序实现上述功能,需要导入 os 模块

文件操作:

方法名 说明 示例

rename 重命名文件 os.rename(源文件名.目标文件名)
remove 删除文件 os.remove(文件名)

例:
import os

#将文件名1改为2
os.rename("1.txt","2.txt")

#删除文件
os.remove("2.txt")


目录操作:

方法名 说明 示例

listdir 输出指定目录列表 os.listdir(目录名)
mkdir 创建目录 os.mkdir(目录名)
rmdir 删除目录 os.rmdir(目录名)
getcwd 获取当前目录         os.getcwd()
chdir 修改工作目录 os.chdir(目标目录)
path.isdir                 判断是否是文件 os.path.isdir(文件路径)

提示:文件或者目录操作都支持相对路径和绝对路径

例:
import os

#Linux操作系统终端
os.listdir(".")

#判断是否为文件
os.path.isdir("文件名")

#创建文件 文件1
os.mkdir("文件1")

#删除文件 文件1
os.rmdir("文件1")




7--文本文件的编码格式(了解)

。--文本文件存储的内容是基于字符编码的文件,常见的编码由ASCII编码、UNICODE编码等

--Python2.x默认使用ASCII编码
--Python3.x默认使用UTF-8编码

。--ASCII编码

--计算机中只有256个ASCII字符
--一个ASCII在内存中占用1个字节的空间
-8个0或1的排列组合方式一共有256中,也就是2的8次方

。--UTF-8编码格式

--计算机中使用1~6个字节来标识UTF-8字符,涵盖了地球上几乎所有地区的文字
--大多数汉字会使用3个字节表示
--UTF-8是UNICODE编码的一种编码格式


8--Python2.x中如何使用中文

。--在Python2.x文件的第一行,增加以下代码,解释器会以UTF-8编码来处理Python文件

--这是官方推荐使用的 # *-* coding:utf8 *-*
--也可以使用: #coding=utf8

。--Unicode字符串

--在Python2.x中,即使指定了文件使用UTF-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串
--要能够正确的遍历字符串,在定义字符串时,需要在字符串的引号前,增加一个小写字母 u ,
告诉解释器这是一个Unicode字符串(使用UTF-8编码格式的字符串)
阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页