Python 文件处理

01_file文件操作_操作系统底层关系_写入文件

   a.数据库的底层操作就是文件操作

   b.文本文件:存储字符的文件,可以用记事本打开的文件(Word文档不是文本文件),默认使用Unicode字符集(采用两个字节表示一个符号)

    二进制文件:Word文档、图片文件、无法用记事本打开的,数据是用字节为单位。

  c.相关模块概述

  d.创建文件对象 open() :这个对象来(映射)代表外部真实的文件,对他进行操作时会通过io流同步到真实文件,

     基本语法格式:open(文件名,打开方式)  

     文件名可以写绝对路径,录入的时候可以在文件名前面写个r,避免转义字符的录入。

     打开方式:r:读模式; w 写模式(如果文件不存在则创建,否则重写内容); a 追加模式 (如果文件不存在则创建,若文件存在则在文件末尾追加内容);b 二进制模式;+ 读写模式。

     <注>如果我们没有增加模式“b”,则默认创建的是文本文件对象,处理的基本单元是“字符”,如果是二进制模式“b”,则创建出来的是二进制模式“b”,则创建的是二进制文件对象,处理的基本单元是“字节”

e.基本的文件写入操作:创建文件对象--->写入数据--->关闭文件对象

    

02_编码知识_中文乱码问题解决

ASCII :七位

ISO8859-1:兼容ASCII码,不兼容unicode 。是一个8位单字节字符

GB2312

GBK

GB18030:可表示藏文等

Unicode:(表示全世界所有的字符)

UTF-8:变长编码

<注>1.编码和解码应当一致,否则会造成乱码

       2.python程序使用的Unicode,但是实际存储一般都使用的是UTF-8,Unicode中虽然汉字是两个字节,UTF-8中汉字是3个字节,但是互联网中,一个网页也包含了大量的英文字母,这些英文字母只占用一个字节

       3.Windows操作系统默认的编码是GBK,Linux操作系统默认的编码是UTF-8。当我们用open()时,调用的是操作系统打开的文件,默认的编码是GBK

       

f=open(r"12.txt","w")
s="李萌"
f.write(s)
f.close()

     所以,以上代码在第三条规则里将乱码。但是可以选择file encoding中的GBK,重新进行编码,此时不会再出现乱码

上述代码在啊Linux系统中则不会出现乱码。

 

03_关闭流要点1_try异常管理

   <补充>write(a):把字符串a 写入到文件中

              writeline(b):把字符串列表写入文件中,不添加换行符。

      a.close()关闭文件流:文件是在硬盘上,通过操作系统去操作文件。调用close方法,在操作系统中打开的相关的资源全部关闭和释放。若当在close方法调用前的程序语句出现了问题,将导致无法关闭,这时我们需要借助异常机制,仍然可以执行close语句,将其成功关闭。

try:
   f=open(r"12.txt","w")
   str=["aa\n","bb\n"]
   f.writelines(str)
except BaseException as e: #打印异常
    print(e)
finally:#有没有异常,都将执行最后一条语句
   f.close()

  b.由于文件底层是由操作系统控制,所以我们打开的文件对象必须显示调用close()方法关闭文件对象。当调用close()方法时,首先会把缓冲区数据写入文件(也可以直接调用flush()方法),再关闭文件,释放文件对象。

 

04_关闭流要点2_with上下文管理_现场还原

     a.with 语句:上下文管理器(可以直接写入,不需要关闭)

a=["李\n","萌\n"]
with open(r"12.txt","w") as f:
    f.writelines(a)

 

05_文本文件的读取

文件的读取一般使用如下三个方法:
1.read([size]):从文件中读取size个字符,并作为结果返回,如果没有size参数,则读取整个文件,读取到文件末尾会返回空字符串

2.readline():读取一行内容作为结果返回。读取到文件末尾会返回空字符串

3.readlines():文本文件中,每一行作为一个字符串存入列表中,返回该列表

with open(r"12.txt","r",encoding="utf-8")as f:
    str=f.read(3)
    print(str)
with open(r"12.txt", "r", encoding="utf-8")as f:
    while True:
        str1=f.readline()
        if not str1:
            break
        else:
            print(str1,end=" ")
#使用迭代器
with open(r"12.txt","r",encoding="utf-8")as f:
    for a in f:
        print(a,end=" ")
with open(r"12.txt","r",encoding="utf-8")as f:
    str2 = f.readlines()
    print(str2)

 

06_enumerate()函数和推导式生成列表_操作每行增加行号

#a=["李\n","萌\n"]
#b=enumerate(a) #推导式生成
#print(a)
#print(list(b))
with open( "12.txt","r",encoding="utf-8")as f:
    lines=f.readlines()
    lines=[line.rstrip()+"   #"+str(index)+"\n"for index,line in enumerate(lines)]
with open("12.txt","w",encoding="utf-8")as f:
    f.writelines(lines)

 

 

07_二进制文件的读写_图片文件拷贝

with open("23.jpg","rb") as f:
    with open("21.jpg","wb")as s:
        for line in f.readlines():
            s.write(line)

print("拷贝完成")

 

08_文件对象常用方法和属性总结_seek()任意位置操作

1.seek(offset[,whence])  offset表示相对于whence的多少个字节的偏移量;whence不同的值代表不同的含义:0:从文件头开始计算(默认值),1:从当前位置开始计算,2:从文件尾开始计算。

2.tell() :返回文件指针的当前位置

3.truncate([size]) :无论指针在什么位置,只留下指针前size个字节的内容,其余全部删除。如果没有传入size,则将指针当前位置到文件末尾内容全部删除

with open("12.txt","r",encoding="utf-8") as f:
    print("文件名为:{0}".format(f.name))
    print("指针的位置:{0}".format(f.tell()))
    print("读取的内容:{0}".format(f.readline()))
    print("指针的位置:{0}".format(f.tell()))
    print("读取的内容:{0}".format(f.readline()))
    print("指针的位置:{0}".format(f.tell()))
    f.seek(7)
    print("读取的内容:{0}".format(f.readline()))
    print("指针的位置:{0}".format(f.tell()))
with open("12.txt", "w", encoding="utf-8") as f:
    f.truncate(10)

 

09_使用pickle实现序列化和反序列化_神经元记忆移植

  1.序列化是指:将对象转化成为“串行化”数据形式,存储到硬盘或通过网络传输到其他地方。

    反序列化是指:相反的过程,将读取到的“串行化数据”转化成对象

    我们可以使用pickle模块中的函数,实现序列化和反序列化

    序列化我们使用:

               pickle.dump(obj,file) obj就是要被序列化的对象,file是指存储的文件

               pickle.load(file)  从file读取数据,反序列化成对象

#将对象序列化到文件中
import pickle
with open(r"12.txt","wb")as f:
    a1="李"
    a2="萌"
    pickle.dump(a1,f)
    pickle.dump(a2,f)
#将或得的数据反序列成对象
with open(r"12.txt","rb")as f:
    a1=pickle.load(f)
    a2=pickle.load(f)
    print(a1)
    print(a2)



10_CSV文件的读取_写入

CSV是逗号分隔符文本格式,常用于数据交换,Excel文件和数据库数据的导入和导出,与Excel文件不同,CSV文件中:

1.值没有类型,所有值都是字符串

2.不能指定字体颜色等样式

3.不能指定单元格的宽高,不能合并单元格

4.没有多个工作表

5.不能嵌入图像图表

#测试CSV文件的读取和写入
import csv
with open("meng.csv","r")as f:
    a=csv.reader(f)
   # print(list(a))
    for row in a:
        print(row)

with open("xiao.csv","w")as f:
    b=csv.writer(f)
    b.writerow(["李沈萌","8","女"])
    c=[["李","5","女"],["萌","7","男"]]
    b.writerows(c)

 

11_os模块_调用操作系统可执行文件_控制台乱码问题

 1.os模块可以帮助我们直接对操作系统进行操作。我们可以直接调用操作系统的可执行文件、命令,直接操作文件、目录等等。在系统运维的核心基础

import os
#os.system("notepad.exe")
#os.system("regedit")
#os.system("ping.www.baidu.com")
#os.system("cmd")

#直接调用可执行的文件
os.startfile(r"C:\Program Files (x86)\Tencent\WeChat\WeChat.exe")

 

12_os模块_获得文件信息_创建文件夹_递归创建

1.os模块下常用操作文件的方法:

    remove(path):删除指定的文件

    rename(src.dest):重命名文件或目录

    stat(path):返回文件的所有属性

   listdir(path):返回path目录下的文件和目录列表

2.os模块下关于目录操作的相关办法

  mkdir(path):创建目录

  makedirs(path1、path2、... ...):创建多级目录

  rmdir(path):删除目录

  removedirs(path1、path2、... ...):删除多级目录(前提:目录里面是空的才能删除,如果目录里面有内容将无法删除)

  getcwd():返回当前工作目录:current work dir

  chdir(path):把path设为当前工作目录

  walk[]:遍历目录树

  sep:当前操作系统所使用的路径分隔符

  

#测试os模块中,关于文件和目录的操作
import os
###############获取文件和文件夹相关的信息####################
#print(os.name)   #Windows返回的是nt;Linux和unix返回的是posix
#print(os.sep)    #Windows返回的是\;Linux和unix返回的是/
#print(repr(os.linesep))#Windows返回的是\r\n;Linux返回的是\n\
#print(os.stat("Python5.py"))

###############关于工作目录的操作####################
#print(os.getcwd())#当前工作目录
#os.chdir("d:")  #改变当前工作目录
#os.mkdir("meng")

###############关于创建目录,创建和删除多级目录####################
#os.mkdir("meng")
#os.rmdir("meng")#相对路径都是相对于当前的工作目录
#os.makedirs("li/shen/meng")
#os.removedirs("li/shen/meng") #如果目录下面有内容,则会报错目录不为空,无法成功删除
#os.makedirs("../热爱")#...指上一级目录
#os.rename("meng","limeng")
r=os.listdir("li")
print(r )
###################################

 

13_os.path模块_常用方法

os.path模块提供了目录相关(路径判断、路径切分、路径连接、文件夹遍历)的操作

#测试os.path中关于目录、路径的操作
# import os
import os.path
a=os.path.isabs("c:/15.txt")
print(a)
from os import path
print(path.isdir("c:/15.txt"))
print(path.isfile("d:/学生手册答案(改).doc"))
print(path.exists("c:/15.txt"))
#获得文件的基本信息
print(path.getsize("15.txt"))#获取字节
print(path.abspath("15.txt"))#获取绝对路径
print(path.dirname("C:/15.txt"))#输出所在目录
print(path.getatime("15.txt"))
#对路径的操作
a =path.abspath("12.txt")
print( path.split(a ))
print( path.splitext(a ))
print(path.join("aa","bb"))

 

#列出工作目录下所有的py文件,并输出文件名

import os
path=os.getcwd()
a=os.listdir(path)#列出列表,子文件
for b in a:
    if b.endswith("py"):
        print(b)

print("######")
c=[b for b in os.listdir(path)if b.endswith("py")]
for m in c:
    print(m)

 

14_os模块_使用walk遍历

os.walk()方法:返回一个3个元素的元组,(dirpath,dirnames,filenames)

dirpath:要列出指定目录的路径

dirnames:目录下的所有文件夹

filenames:目录下的所有文件

#测试os.walk()递归遍历所有的子目录和子文件
import os
m=[]
a=os.getcwd()
b=os.walk(a)
for dirpath,dirnames,filenames in b:
    for dir in dirnames:
        m.append(os.path.join(dirpath,dir))
    for file in filenames :
        m.append(os.path.join(dirpath, file))
print(m)

 

15_shutil模块_文件和目录拷贝

shutil模块是Python标准库中提供的,主要用来做文件和文件夹的拷贝、移动和删除等,还可以做文件和文件夹的压缩、解压缩操作

os模块提供了对目录或文件的一般操作,shutil模块作为补充,提供了移动、复制、压缩、解压等操作

#测试shutil模块的用法,拷贝/压缩
import shutil
#shutil.copyfile("15.txt","16.txt")
shutil.copytree("li","liguu",)#只能拷贝新目录

 

16_shutil和zipfile模块_压缩和解压缩

#压缩、解压缩
import zipfile
import shutil
#shutil.make_archive("lig/xixi","zip","li/shen")# 压缩包的位置和名字,压缩的格式,要压缩的内容
#z1=zipfile.ZipFile("a.zip","w")
#z1.write("15.txt")
#z1.close()
z2=zipfile.ZipFile("a.zip","r")
z2.extractall("limeng")
z2.close()

 

 

17_递归算法原理_阶乘计算

递归结构包括两个部分:

1.定义递归头      2.递归体

#测试递归算法
c=1
def a1():
    print("a1")
    global c
    c=c+1
    if c<=5:
       a1()

def b1():
    print("b1")

a1()
#使用递归求阶乘
sum=1
print("请输入一个数字:")
n=input()
n=int(n)
def a():
    global n,sum
    if n>0:
        sum=sum*n
       # print(sum,n)
        n=n-1
        a()
    else:
        print("该数字的阶乘结果为:",sum)

a()

 

18_递归算法原理_目录树结构展示

#测试递归打印所有的目录和文件
import os
m=[]
def getfile(path,level):
    a=os.listdir(path)
    for b in a:
        c=os.path.join(path,b)
        if os.path.isdir(c):
            getfile(c,level+1)
        m.append("\t"*level+c)
getfile("li",0)
for j in reversed(m):
    print(j)


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值