Python基础学习（五）

最新推荐文章于 2022-07-21 22:17:18 发布

And ν

最新推荐文章于 2022-07-21 22:17:18 发布

阅读量469

点赞数

文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/ftmht/article/details/122802521

版权

Write()/Writelines()写入数据

seek（offset[,whence]）

文件操作

文本文件和二进制文件

1.文本文件

文本文件是存储普通字符的文本，默认为Unicode字符集，可以使用记事本程序打开，但是，像Word软件编辑的文档不是文本文件

2.二进制文件

二进制文件把数字内容用字符进行存储，无法用记事本打开，必须使用专业的软件解码

文件操作相关模块概述

模块	作用
io模块	文件流的输入和输出操作
os模块	基本操作系统功能，包括文件操作
glob模块	查找符合特定规则的文件路径名
fnmatch模块	使用模式来匹配文件路径名
fileinput模块	处理多个文件输入
filecmp模块	用于文件的比较
CSV模块	用于CSV文件处理
pickle和cpickle	用于序列化和反序列化
xml包	用于xml数据处理
bz2、gzip、zipfile、zlib、tarfile	用于处理压缩和解压缩文件
	（分别对应不同的算法）

创建文件对象

open（）函数

基本语法： open（文件名[，打开方式]）

如果只是文件名，代表当前目录下的文件；文件名可以录入全路径

若在文件路径名前加“r”，可省略一个"\"

打开方式：

r	读模式
w	写模式，若文件不存在则创建，存在则重写写新内容
a	追加模式，若文件不存在则创建，存在则在文件末尾追加内容
b	二进制（可与其他模式组合后使用）
+	读、写模式（与其他模式组合后使用）

文本文件的写入

1.创建文本文件

2.写入数据

3.关闭文件对象

常见编码介绍

编码的演变：

中文乱码问题

Windows操作系统默认编码是GBK，Linux操作系统默认编码是UTF-8.当用open（）时，调用的是操作系统打开的文件，默认编码是GBK

#中文编码问题
f=open(r"a.txt", "a", encoding="UTF-8")     #在open中加入ebcoding=，=后面加编码类型，可使其文本按照其编码类型打开
f.write("白展堂\n一二三四五")
f.close()

Write()/Writelines()写入数据

write（a）：把字符串a写入到文件中

writelines（b）：把字符串列表b 文件中，不添加换行符

close（）关闭文件流

由于文件底层是由操作系统控制，所以打开的文件对象必须显式调用close（）方法关闭文件对象，当调用close（）方法时，首先会将缓存区数据写入文件(也可以直接调用flush（）方法)，再关闭文件，释放文件对象。

为了确保打开的文件关闭正常，一般结合异常机制的finally或者with关键字实现无论何种情况都关闭打开的文件对象。

文本文件的读取

1.read（[size]）:

从文件中读取size个字符，并作为返回，若无size参数，则读取整个文件，读取到文件末尾，会返回空字符串

2.readline（）

读取一行内容作为结果返回，读到文件末尾会返回空字符串

3.Readlines（）

文本文件中，每一行作为一个字符串存到列表中，返回该列表

#读取操作read、readline、Readlines
with open(r"a.txt", "r", encoding="utf-8") as f:
   str=f.read()
   print(str)

with open(r"a.txt", "r", encoding="utf-8") as f:
   while True:
      s=f.readline()
      if not s:
        break
      else:
         print(s,end="")

   with open(r"a.txt", "r",encoding="utf-8") as f:
      for x in f:
         print(x,end="")
'''
输出：
白展堂
一二三四五
白展堂
一二三四五白展堂
一二三四五
'''

二进制文件的读取和写入

二进制文件的处理流程与文本文件一致，首先应要创建文件对象，不过，需要指定二进制模式，从而创建出二进制文件对象

f = open(r"d:\a.txt","wb")  #可写的，重写模式的
f = open(r"d:\a.txt","ab")  #可写的，追加模式的
f = open(r"d:\a.txt","rb")  #可读的

创建好二进制文件对象后，仍然可以使用write（）、read（）实现文件的读写操作

文件对象的常用属性和方法

属性或方法	作用
name	返回文件的名字
mode	返回文件的打开模式
closed	若文件被关闭则返回True
readline （）	从文本文件中读取一行内容
tell（）	返回文件指针的当前位置

seek（offset[,whence]）

把文件指针移动到新的位置，offset表示相对于whence的位置

offset：其为正，则往结束方向移动；为负，则往开始方向移动

whence不同值代表不同含义：

0：从文件都开始计算

1：从当前位置开始计算

2：从文件末尾开始计算

出现：“io.Unsupported Operation :Can't do nonzero end-relation seeks 错误

是因为Python2和Python3的问题，若在Python2 中不会报错。因Python3在文本文件中，没有使用b模式选项打开文件，因此只允许从文件头开始计算相对位置，从文件尾计算就会发生异常

truncate（[size]）

不论指针在什么位置，只留下指针前size个字符的内容，其余全部删除，若未传入size值，则从指针当前位置到文件末尾全部删除

#测试truncate方法
with open(r"a.txt", "w",encoding='utf-8') as f:
   f.truncate()
# 删除a.txt中所有内容

使用pickle序列化

序列化：将对象转化成“串行化”数据形式，储存到硬盘或通过网络传输到其他地方

反序列化：指相反的过程，将读取到的“串行化数据”转化成对象

序列化使用：

pickle.dump(obj, file)

obj就是要被序列化的对象，file指的是储存的文件

pickle.load(file)

从file读取数据，反序列化成对象

#测试序列化和反序列化
import pickle

a1="小高"
a2=123
a3=[10,20,39]
with open("data.dat","wb") as f:
    pickle.dump(a1,f)
    pickle.dump(a2,f)
    pickle.dump(a3,f)

with open("data.dat","rb") as f:
    b1=pickle.load(f)
    b2=pickle.load(f)
    b3=pickle.load(f)
    print(b1);print(b2);print(b3)
'''
输出：
小高
123
[10, 20, 39]
'''

CSV文件简介

CSV是逗号分隔符文本格式，常用于数据交换。Excel文件和数据库数据的导入和导出，与Excel文件不同，CSV文件中：

1.值没有类型，所有的值都是字符串

2.不能指定字体、颜色等样式

3.不能指定单元格的高宽，不能合并单元格

4.没有多个工作表

5.不能嵌入图像、图表

os和os.path模块

os模块可帮助我们直接对操作系统进行操作，可以直接调用操作系统的可执行文件、命令、直接操作文件、目录等等，在系统运维的核心、基础

os调用操作系统文件和命令

os.system 可直接调用系统的命令

import os
os.system("notepad.exe")    #调用Windows系统的记事本程序
os.system("ping www.baidu.com") #调用ping命令打开百度网页

os模块—文件和目录操作

os模块下常用的文件的操作方法：

方法	说明
remove（path）	删除指定的文件
rename（src，dest）	重命名文件或目录
stat(path)	返回文件的所有属性
listdir（path）	返回path目录下的文件和目录列表

os模块下关于目录操作的相关方法

方法	说明
mkdir（path）	创建目录
makedirs（path1\path2\...）	创建多级目录
rmdir（path）	删除目录
removedirs（path1\path2\...）	删除多级目录

#测试os模块中关于文件和目录的一些操作
import os

##############获取文件和文件夹的相关信息#################
print(os.name)      #windows是nt，linux和unix是posix
print(os.sep)       #windows是\，linux和unix是/
print(repr(os.linesep)) #windows是\r\n，linux和unix是\n\
print(os.stat("mypy07.py"))

##############关于工作目录的操作#################
print(os.getcwd())    #获取当前工作目录路径
os.chdir("D:")  #改变当前工作目录
os.mkdir("书籍")       #创建目录
#############创建目录、创建多级目录、删除#################
os.mkdir("书籍")
os.rmdir("书籍")  #删除“书籍”这个目录     相对路径都是相对于当前工作目录
os.makedirs("书籍/虚拟现实/余华")   #创建多级目录
os.removedirs("书籍/虚拟现实/余华") #只能删除多级空目录
os.rename("书籍","图像")
print(os.listdir("书籍"))

repr（）函数

描述：repr（）函数将对象转化为供解释器读取的形式

语法：repr（object）

返回值：一个对象的string格式

os.path模块

os.path模块提供了相关目录相关（路径判断、路径切分、路径连接、文件夹遍历）的操作

方法	说明
isabs（path）	判断path是否为绝对路径
isdir（path）	判断path是否为目录
isfile（path）	判断path是否为文件
exists(path)	判断指定路径的文件是否存在
getsize（filename）	返回文件大小
abspath（path）	返回绝对路径
dirname（p）	返回目录的路径
getctime（filename）	返回文件的创建时间
getatime（filename）	返回文件的最后返回时间
getmtime（filename）	返回文件的最后修改时间
walk（top，func，arg）	递归方式遍历目录
join（path，*paths）	连接多个path
split（path）	对路径进行分割，以列表形式返回
splitext（path）	从路径中分割文件的拓展名

#测试os.path模块
import os
import os.path      #from os import path    #调用时可将os去掉
print(os.path.isabs("E:\\a.txt"))   #判断path是否为绝对路径
print(os.path.isdir("a.txt"))   #判断path是否为目录
print(os.path.isfile("a.txt"))  #判断path是否是文件
print(os.path.exists("a.txt"))  #判断该路径下文件是否存在

print(os.path.getsize("a.txt"))     #返回文件大小
print(os.path.abspath("a.txt"))     #返回绝对路径
print(os.path.dirname("a.txt"))     #返回目录的路径
print(os.path.getctime("a.txt"))    #返回path的创建时间
print(os.path.getatime("a.txt"))    #返回path最后的访问时间
print(os.path.getmtime("a.txt"))    #返回path最后的创建时间
print(os.path.join("aa","bb","cc")) #连接多个path
print(os.path.split("a.txt"))   #对路径进行切割，以列表形式返回
print(os.path.splitext("a.txt"))    #从路径中分隔文件的拓展名

walk（）递归遍历所有文件

os.walk()方法

返回一个3个元素的元组（dirpath，dirnames，filenames）

dirpath：要列出的指定目录的路径

dirnames：目录下的所有文件夹

filenames：目录下的所有文件

#测试os.walk递归遍历所有子目录和子文件
import os

all_file=[]
path = os.getcwd()  #返回当前工作目录
file=os.walk(path)
for dirpath,dirnames,filenames in file:
    for dir in dirnames:
       all_file.append(os.path.join(dirpath,dir))
    for file in filenames:
        all_file.append(os.path.join(dirpath,file))

#打印所有子目录和子文件
for f in all_file:
    print(f)

shutil模块（拷贝和压缩）

shutil模块是Python标准库中提供的，主要用来做文件和文件夹的拷贝、移动、删除等操作，还可以做文件和文件夹的压缩和解压缩操作

os模块提供了对目录或文件的一般操作，shutil模块作为补充，提供了移动、复制、压缩、解压缩等操作，这些os模块中都没有提供

#测试shutil模块的用法：拷贝、压缩
import shutil
# 拷贝
shutil.copyfile("a.txt", "b.txt")
shutil.copytree("书籍/虚拟现实","books")  #books目录不存在时才能正常拷贝
shutil.copytree("书籍/虚拟现实","books", ignore=shutil.ignore_patterns("*.txt", "*.html"))    #拷贝时不拷贝.txt和.html结尾的文件
# 压缩
shutil.make_archive("书籍/n", "zip", "书籍/虚拟现实")   #将书籍旗下的虚拟现实进行压缩，并将压缩包放入书籍旗下的n文件夹中

import zipfile
# 拷贝
z1 = zipfile.ZipFile("d:/a.zip", "w")
z1.write("a.txt")
z1.write("b.txt")
z1.close()
# 压缩
z2=zipfile.ZipFile("d:/a.zip","r")
z2.extractall("书籍")
z2.close()

递归算法

递归是一种常见的解决问题的方法，即把问题逐渐简单化，递归的基本思想就是“自己调用自己”，一个使用递归技术的方法，将会直接或间接的调用自己

定义：

递归头（也就是递归的结束条件）：什么时候不调用自身的方法，如果没有头，将会陷入死循环

递归体：什么时候需要调用自身方法

#递归打印所有目录和文件
import os

allfile=[]
def getAllFiles(path,level):
    childFile=os.listdir(path)
    for file in childFile:
        filepath=os.path.join(path,file)
        if os.path.isdir(filepath):
            getAllFiles(filepath, level+1)
        allfile.append("\t"*level+filepath)

getAllFiles("E:\python project\py project 01",0)
for x in reversed(allfile):
    print(x)