Python 文件处理

最新推荐文章于 2022-12-30 17:26:48 发布

liuyangxiaolu

最新推荐文章于 2022-12-30 17:26:48 发布

阅读量211

点赞数

本文链接：https://blog.csdn.net/liuyangxiaolu/article/details/100015983

版权

01_file文件操作_操作系统底层关系_写入文件

a.数据库的底层操作就是文件操作

b.文本文件：存储字符的文件，可以用记事本打开的文件（Word文档不是文本文件），默认使用Unicode字符集（采用两个字节表示一个符号）

二进制文件：Word文档、图片文件、无法用记事本打开的，数据是用字节为单位。

c.相关模块概述

d.创建文件对象 open() ：这个对象来（映射）代表外部真实的文件，对他进行操作时会通过io流同步到真实文件，

基本语法格式：open(文件名，打开方式)

文件名可以写绝对路径，录入的时候可以在文件名前面写个r，避免转义字符的录入。

打开方式：r:读模式； w 写模式（如果文件不存在则创建，否则重写内容）； a 追加模式 (如果文件不存在则创建，若文件存在则在文件末尾追加内容)；b 二进制模式；+ 读写模式。

<注>如果我们没有增加模式“b”，则默认创建的是文本文件对象，处理的基本单元是“字符”，如果是二进制模式“b”，则创建出来的是二进制模式“b”，则创建的是二进制文件对象，处理的基本单元是“字节”

e.基本的文件写入操作：创建文件对象--->写入数据--->关闭文件对象

02_编码知识_中文乱码问题解决

ASCII :七位

ISO8859-1:兼容ASCII码，不兼容unicode 。是一个8位单字节字符

GB2312

GBK

GB18030：可表示藏文等

Unicode：（表示全世界所有的字符）

UTF-8:变长编码

<注>1.编码和解码应当一致，否则会造成乱码

2.python程序使用的Unicode,但是实际存储一般都使用的是UTF-8，Unicode中虽然汉字是两个字节，UTF-8中汉字是3个字节，但是互联网中，一个网页也包含了大量的英文字母，这些英文字母只占用一个字节

3.Windows操作系统默认的编码是GBK，Linux操作系统默认的编码是UTF-8。当我们用open()时，调用的是操作系统打开的文件，默认的编码是GBK

f=open(r"12.txt","w")
s="李萌"
f.write(s)
f.close()

所以，以上代码在第三条规则里将乱码。但是可以选择file encoding中的GBK，重新进行编码，此时不会再出现乱码

上述代码在啊Linux系统中则不会出现乱码。

03_关闭流要点1_try异常管理

<补充>write（a）:把字符串a 写入到文件中

writeline（b）:把字符串列表写入文件中，不添加换行符。

a.close（）关闭文件流：文件是在硬盘上，通过操作系统去操作文件。调用close方法，在操作系统中打开的相关的资源全部关闭和释放。若当在close方法调用前的程序语句出现了问题，将导致无法关闭，这时我们需要借助异常机制，仍然可以执行close语句，将其成功关闭。

try:
   f=open(r"12.txt","w")
   str=["aa\n","bb\n"]
   f.writelines(str)
except BaseException as e: #打印异常
    print(e)
finally:#有没有异常，都将执行最后一条语句
   f.close()

b.由于文件底层是由操作系统控制，所以我们打开的文件对象必须显示调用close（）方法关闭文件对象。当调用close()方法时，首先会把缓冲区数据写入文件（也可以直接调用flush()方法），再关闭文件，释放文件对象。

04_关闭流要点2_with上下文管理_现场还原

a.with 语句：上下文管理器（可以直接写入，不需要关闭）

a=["李\n","萌\n"]
with open(r"12.txt","w") as f:
    f.writelines(a)

05_文本文件的读取

文件的读取一般使用如下三个方法：
1.read([size]):从文件中读取size个字符，并作为结果返回，如果没有size参数，则读取整个文件，读取到文件末尾会返回空字符串

2.readline()：读取一行内容作为结果返回。读取到文件末尾会返回空字符串

3.readlines()：文本文件中，每一行作为一个字符串存入列表中，返回该列表

with open(r"12.txt","r",encoding="utf-8")as f:
    str=f.read(3)
    print(str)
with open(r"12.txt", "r", encoding="utf-8")as f:
    while True:
        str1=f.readline()
        if not str1:
            break
        else:
            print(str1,end=" ")
#使用迭代器
with open(r"12.txt","r",encoding="utf-8")as f:
    for a in f:
        print(a,end=" ")
with open(r"12.txt","r",encoding="utf-8")as f:
    str2 = f.readlines()
    print(str2)

06_enumerate()函数和推导式生成列表_操作每行增加行号

#a=["李\n","萌\n"]
#b=enumerate(a) #推导式生成
#print(a)
#print(list(b))
with open( "12.txt","r",encoding="utf-8")as f:
    lines=f.readlines()
    lines=[line.rstrip()+"   #"+str(index)+"\n"for index,line in enumerate(lines)]
with open("12.txt","w",encoding="utf-8")as f:
    f.writelines(lines)

07_二进制文件的读写_图片文件拷贝

with open("23.jpg","rb") as f:
    with open("21.jpg","wb")as s:
        for line in f.readlines():
            s.write(line)

print("拷贝完成")

08_文件对象常用方法和属性总结_seek()任意位置操作

1.seek(offset[，whence]) offset表示相对于whence的多少个字节的偏移量；whence不同的值代表不同的含义：0：从文件头开始计算（默认值），1：从当前位置开始计算，2：从文件尾开始计算。

2.tell() ：返回文件指针的当前位置

3.truncate（[size]）：无论指针在什么位置，只留下指针前size个字节的内容，其余全部删除。如果没有传入size，则将指针当前位置到文件末尾内容全部删除

with open("12.txt","r",encoding="utf-8") as f:
    print("文件名为：{0}".format(f.name))
    print("指针的位置：{0}".format(f.tell()))
    print("读取的内容：{0}".format(f.readline()))
    print("指针的位置：{0}".format(f.tell()))
    print("读取的内容：{0}".format(f.readline()))
    print("指针的位置：{0}".format(f.tell()))
    f.seek(7)
    print("读取的内容：{0}".format(f.readline()))
    print("指针的位置：{0}".format(f.tell()))
with open("12.txt", "w", encoding="utf-8") as f:
    f.truncate(10)

09_使用pickle实现序列化和反序列化_神经元记忆移植

1.序列化是指：将对象转化成为“串行化”数据形式，存储到硬盘或通过网络传输到其他地方。

反序列化是指：相反的过程，将读取到的“串行化数据”转化成对象

我们可以使用pickle模块中的函数，实现序列化和反序列化

序列化我们使用：

pickle.dump(obj,file) obj就是要被序列化的对象，file是指存储的文件

pickle.load(file) 从file读取数据，反序列化成对象

#将对象序列化到文件中
import pickle
with open(r"12.txt","wb")as f:
    a1="李"
    a2="萌"
    pickle.dump(a1,f)
    pickle.dump(a2,f)
#将或得的数据反序列成对象
with open(r"12.txt","rb")as f:
    a1=pickle.load(f)
    a2=pickle.load(f)
    print(a1)
    print(a2)

10_CSV文件的读取_写入

CSV是逗号分隔符文本格式，常用于数据交换，Excel文件和数据库数据的导入和导出，与Excel文件不同，CSV文件中：

1.值没有类型，所有值都是字符串

2.不能指定字体颜色等样式

3.不能指定单元格的宽高，不能合并单元格

4.没有多个工作表

5.不能嵌入图像图表

#测试CSV文件的读取和写入
import csv
with open("meng.csv","r")as f:
    a=csv.reader(f)
   # print(list(a))
    for row in a:
        print(row)

with open("xiao.csv","w")as f:
    b=csv.writer(f)
    b.writerow(["李沈萌","8","女"])
    c=[["李","5","女"],["萌","7","男"]]
    b.writerows(c)

11_os模块_调用操作系统可执行文件_控制台乱码问题

1.os模块可以帮助我们直接对操作系统进行操作。我们可以直接调用操作系统的可执行文件、命令，直接操作文件、目录等等。在系统运维的核心基础

import os
#os.system("notepad.exe")
#os.system("regedit")
#os.system("ping.www.baidu.com")
#os.system("cmd")

#直接调用可执行的文件
os.startfile(r"C:\Program Files (x86)\Tencent\WeChat\WeChat.exe")

12_os模块_获得文件信息_创建文件夹_递归创建

1.os模块下常用操作文件的方法：

remove（path）：删除指定的文件

rename（src.dest）：重命名文件或目录

stat（path）：返回文件的所有属性

listdir（path）：返回path目录下的文件和目录列表

2.os模块下关于目录操作的相关办法

mkdir（path）：创建目录

makedirs（path1、path2、... ...）：创建多级目录

rmdir（path）：删除目录

removedirs（path1、path2、... ...）：删除多级目录（前提：目录里面是空的才能删除，如果目录里面有内容将无法删除）

getcwd（）：返回当前工作目录：current work dir

chdir（path）：把path设为当前工作目录

walk[]：遍历目录树

sep：当前操作系统所使用的路径分隔符

#测试os模块中，关于文件和目录的操作
import os
###############获取文件和文件夹相关的信息####################
#print(os.name)   #Windows返回的是nt；Linux和unix返回的是posix
#print(os.sep)    #Windows返回的是\；Linux和unix返回的是/
#print(repr(os.linesep))#Windows返回的是\r\n；Linux返回的是\n\
#print(os.stat("Python5.py"))

###############关于工作目录的操作####################
#print(os.getcwd())#当前工作目录
#os.chdir("d:")  #改变当前工作目录
#os.mkdir("meng")

###############关于创建目录，创建和删除多级目录####################
#os.mkdir("meng")
#os.rmdir("meng")#相对路径都是相对于当前的工作目录
#os.makedirs("li/shen/meng")
#os.removedirs("li/shen/meng") #如果目录下面有内容，则会报错目录不为空，无法成功删除
#os.makedirs("../热爱")#...指上一级目录
#os.rename("meng","limeng")
r=os.listdir("li")
print(r )
###################################

13_os.path模块_常用方法

os.path模块提供了目录相关（路径判断、路径切分、路径连接、文件夹遍历）的操作

#测试os.path中关于目录、路径的操作
# import os
import os.path
a=os.path.isabs("c:/15.txt")
print(a)
from os import path
print(path.isdir("c:/15.txt"))
print(path.isfile("d:/学生手册答案(改）.doc"))
print(path.exists("c:/15.txt"))
#获得文件的基本信息
print(path.getsize("15.txt"))#获取字节
print(path.abspath("15.txt"))#获取绝对路径
print(path.dirname("C:/15.txt"))#输出所在目录
print(path.getatime("15.txt"))
#对路径的操作
a =path.abspath("12.txt")
print( path.split(a ))
print( path.splitext(a ))
print(path.join("aa","bb"))

#列出工作目录下所有的py文件，并输出文件名

import os
path=os.getcwd()
a=os.listdir(path)#列出列表，子文件
for b in a:
    if b.endswith("py"):
        print(b)

print("######")
c=[b for b in os.listdir(path)if b.endswith("py")]
for m in c:
    print(m)

14_os模块_使用walk遍历

os.walk()方法：返回一个3个元素的元组，（dirpath，dirnames，filenames）

dirpath：要列出指定目录的路径

dirnames：目录下的所有文件夹

filenames：目录下的所有文件

#测试os.walk（）递归遍历所有的子目录和子文件
import os
m=[]
a=os.getcwd()
b=os.walk(a)
for dirpath,dirnames,filenames in b:
    for dir in dirnames:
        m.append(os.path.join(dirpath,dir))
    for file in filenames :
        m.append(os.path.join(dirpath, file))
print(m)

15_shutil模块_文件和目录拷贝

shutil模块是Python标准库中提供的，主要用来做文件和文件夹的拷贝、移动和删除等，还可以做文件和文件夹的压缩、解压缩操作

os模块提供了对目录或文件的一般操作，shutil模块作为补充，提供了移动、复制、压缩、解压等操作

#测试shutil模块的用法，拷贝/压缩
import shutil
#shutil.copyfile("15.txt","16.txt")
shutil.copytree("li","liguu",)#只能拷贝新目录

16_shutil和zipfile模块_压缩和解压缩

#压缩、解压缩
import zipfile
import shutil
#shutil.make_archive("lig/xixi","zip","li/shen")# 压缩包的位置和名字，压缩的格式，要压缩的内容
#z1=zipfile.ZipFile("a.zip","w")
#z1.write("15.txt")
#z1.close()
z2=zipfile.ZipFile("a.zip","r")
z2.extractall("limeng")
z2.close()

17_递归算法原理_阶乘计算

递归结构包括两个部分：

1.定义递归头 2.递归体

#测试递归算法
c=1
def a1():
    print("a1")
    global c
    c=c+1
    if c<=5:
       a1()

def b1():
    print("b1")

a1()

#使用递归求阶乘
sum=1
print("请输入一个数字：")
n=input()
n=int(n)
def a():
    global n,sum
    if n>0:
        sum=sum*n
       # print(sum,n)
        n=n-1
        a()
    else:
        print("该数字的阶乘结果为：",sum)

a()

18_递归算法原理_目录树结构展示

#测试递归打印所有的目录和文件
import os
m=[]
def getfile(path,level):
    a=os.listdir(path)
    for b in a:
        c=os.path.join(path,b)
        if os.path.isdir(c):
            getfile(c,level+1)
        m.append("\t"*level+c)
getfile("li",0)
for j in reversed(m):
    print(j)

liuyangxiaolu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python 文件处理

01_file文件操作_操作系统底层关系_写入文件 a.数据库的底层操作就是文件操作 b.文本文件：存储字符的文件，可以用记事本打开的文件（Word文档不是文本文件），默认使用Unicode字符集（采用两个字节表示一个符号）二进制文件：Word文档、图片文件、无法用记事本打开的，数据是用字节为单位。 c.相关模块概述 d.创建文件对象 open() ：这个对...
复制链接

扫一扫