文件操作

主要内容:

  • 1. 初识文件操作
  • 2. 只读(r, rb)
  • 3. 只写(w, wb)
  • 4. 追加(a, ab)
  • 5. r+读写
  • 6. w+写读
  • 7. a+写读(追加写读)
  • 8. 其他操作方法
  • 9. 文件的修改以及另一种打开文件句柄的方式

1. 初识文件操作 

 使用python来读写文件是非常简单的操作. 我们使用open()函数来打开一个文件, 获取到文件句柄.然后通过文件句柄就可以进行各种各样的操作了.根据打开方式的不同能够执行的操作也会有相应的差异.

 打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的是r(只读)模式

2.只读操作(r, rb)

(1)read

  将文件中的内容全部读取出来. 弊端: 占内存. 如果文件过大.容易导致内存崩溃.

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
content = f.read()
print(content)
f.close()

(2)readline()

   ⼀次读取⼀行数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀ 个\n 所以呢. 需要我们使用strip()方法来去掉\n或者空

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
line1=f.readline().strip()   # 空白: 空格, \t, \n
print(line1)      #张无忌
f.close()

(3)readlines()

    将每⼀行形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是. 容易出现内存崩溃的问题.不推荐使用

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
lst = f.readlines()
print(lst)
for line in lst:
    print(line.strip())
f.close()

(4) 循环读取

# f是一个可迭代对象
f= open("倚天屠龙记",mode="r",encoding="UTF-8")
for line in f:
    print(line.strip())
f.close

(5) read(n) 读取n个字符.

     需要注意的是:如果再次读取. 那么会在当前位置继续去读,而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
content = f.read(2)
print(content)      #张无
f.close()
f= open("倚天屠龙记",mode="rb")
print(f.read(3))
f.close()    #b'\xe5\xbc\xa0'

2. 只写(w, wb)

     写的时候注意. 如果没有文件. 则会创建文件, 如果文件存在. 则将原件中原来的内容删除, 再写入新内容

f = open("write", mode="w", encoding="utf-8")
f.write("周笔畅\n") # 写的时候. 先清空. 再写入. w
f.write("胡辣汤\n")
f.write("实付款\n")
f.flush()
f.close() 
f= open("倚天屠龙记",mode="w",encoding="UTF-8")
f.write("金毛狮王")
f.flush()
f.close()               #金毛狮王
f= open("倚天屠龙记",mode="w",encoding="UTF-8")
f.write("金毛狮王")
f.read()          #UnsupportedOperation: not readable       模式是w. 不不可以执⾏行行读操作
f.flush()
f.close()          

wb模式下. 可以不指定打开文件的编码. 但是在写文件的时候必须将字符串转化成utf-8的 bytes数据

f= open("倚天屠龙记",mode="wb")
f.write("金毛狮王".encode("utf-8"))
f.flush()
f.close()

4. 追加(a, ab)

f = open("倚天屠龙记", mode="a", encoding="utf-8")
f.write("俞岱岩\n") # 追加写
f.write("陈友谅\n")
f.flush()
f.close()

5. r+读写

对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进行写入. 我们以后使用频率最高的模式就是r+ 

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
content = f.read()
f.write("光明左使杨逍")
print(content)
f.flush()
f.close()

错误方式:

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.write("光明左使杨逍")
content = f.read()
print(content)
f.flush()
f.close()                          #将开头内容改为"光明左使杨逍'再往后读

所以记住: r+模式下. 必须是先读取. 然后再写入 

6. w+写读

先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常用

f = open("倚天屠龙记", mode="w+", encoding="utf-8")
f.write("光明左使杨逍")
print(f.read())
f.flush()
f.close()

先读不就好了了么? 错. w+ 模式下, ⼀开始读取不到数据. 然后写的时候再将原来的内容清空,所以极少用

7.a+写读(追加写读)

f = open("倚天屠龙记", mode="a+", encoding="utf-8")
f.write("光明左使杨逍")
# f.seek(0)
print(f.read())
f.flush()
f.close()

    a+模式下, 不论先读还是后读. 都是读取不到数据的. 但是移动光标就可以

8. 其他操作方法

(1)seek(n)

  •    光标移动到n位置,  注意, 移动的单位是byte. 所以如果是UTF-8的中⽂文部分要是3的倍数.     
  •   通常我们使用seek都是移动到开头或者结尾.         移动到开头: seek(0)        移动到结尾: seek(0,2) 
  •    seek的第⼆个参数表示的是从哪个位置进行偏移, 默认是0,  表示开头, 1表示当前位置, 2表示结尾
f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.write("白眉鹰王殷天正青翼蝠王韦一笑")
f.seek(0)      #光标移动到开头
print(f.read())      #读取内容,此时光标移动到结尾
f.seek(0)             #将光标移至开头
f.seek(0,2)           #将光标移至结尾
print(f.read())       #读取内容,什么都没有
f.seek(0)             #移动到开头
f.write("朱元璋")     #写入信息,此时光标在
print(f.tell())        #此时光标位置9
f.flush()
f.close()

(2). tell()

      使用tell()可以帮我们获取到当前光标在什么位置

(3). truncate() 截断文件

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.seek(3)
f.truncate(12) # 如果没有参数. 按照光标来阶段. 如果有参数. 截断到参数位置
f.flush()
f.close()

9. 文件的修改以及另一种打开文件句柄的方式

 文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新 文件的名字改成老⽂文件的名字. 

import os # 引入os模块

with open("alex", mode="r", encoding="utf-8") as f1, \
     open("alex_副本", mode="w", encoding="utf-8") as f2:

    for line in f1:
        new_line = line.replace("good", "ok")
        f2.write(new_line)

os.remove("alex")
os.rename("alex_副本", "alex")

弊端: 一次将所有内容进行读取. 内存溢出. 解决方案: ⼀行⼀行的读取和操作

 另外:关于文件拷贝

f1 = open("G:/路飞01.png", mode="rb")
f2 = open("E:/路飞02.png", mode="wb")
for line in f1:
    f2.write(line)
f1.close()
f2.flush()
f2.close()

 Homework

1.有如下文件,a1.txt,里面的内容为:

  • 老男孩是最好的培训机构,
  • 全心全意为学生服务,
  • 只为学生未来,不为牟利。
  • 我说的都是真的。哈哈

分别完成以下的功能:

a,将原文件全部读出来并打印。

b,在原文件后面追加一行内容:信不信由你,反正我信了。

c,将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了。

d,将原文件全部清空,换成下面的内容:

  • 每天坚持一点,
  • 每天努力一点,
  • 每天多思考一点,
  • 慢慢你会发现,
  • 你的进步越来越大。

e,将原文件内容全部读取出来,并在‘我说的都是真的。哈哈’这一行的前面加一行,‘你们就信吧~’然后将更改之后的新内容,写入到一个新文件:a1.txt。

1.
with open("a1",mode ="r",encoding="utf-8") as f:
    for line in f:
        print(line.strip())

with open("a1",mode ="a",encoding="utf-8") as f:
    f.write("信不信由你,反正我信了")

with open("a1",mode ="r+",encoding="utf-8") as f:
    f.write("信不信由你,反正我信了")
    for line in f:
        print(line.strip())

with open("a1",mode ="w",encoding="utf-8") as f:
    f.write("""每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大。
""")
import os # 引入os模块
#
with open("a1",mode ="r",encoding="utf-8") as f1,\
    open("a1_副本",mode="a",encoding="utf-8" ) as f2:
    # line1 = f1.readline()
    # f2.write(line1)
    # line2 = f1.readline()
    # f2.write(line2)
    # line3 = f1.readline()
    # f2.write(line3)
    #
    # f2.write("你们就信吧\n")
    # line4 = f1.readline()
    # f2.write(line4)
    cont = 0
    for i in f1:
        if cont ==3:
            f2.write("你们就信吧\n")
        f2.write(i)
        cont+=1
os.remove("a1")
os.rename("a1_副本", "a1")

2.有如下文件,t1.txt,里面的内容为:

  • 葫芦娃,葫芦娃,
  • 一根藤上七个瓜
  • 风吹雨打,都不怕,
  • 啦啦啦啦。
  • 我可以算命,而且算的特别准:
  • 上面的内容你肯定是心里默唱出来的,对不对?哈哈

分别完成下面的功能:

  • a,以r+的模式打开原文件,判断原文件是否可读,是否可写。
  • b,以r的模式打开原文件,利用for循环遍历文件句柄。
  • c,以r的模式打开原文件,以readlines()方法读取出来,并循环遍历         readlines(),并分析b,与c 有什么区别?深入理解文件句柄与                readlines()结果的区别。
  • d,以r模式读取‘葫芦娃,’前四个字符。
  • e,以r模式读取第一行内容,并去除此行前后的空格,制表符,换行符。
  • f,以r模式打开文件,从‘风吹雨打.....’开始读取,一直读到最后。
  • g,以a+模式打开文件,先追加一行:‘老男孩教育’然后在从最开始将         原内容全部读取出来。
  • h,截断原文件,留下内容:‘葫芦娃’
# with open("t1",mode ="r+",encoding="utf-8") as f:
#     for line in f:
#         print(line.strip())
#     f.write("你说的对")

# with open("t1",mode ="r",encoding="utf-8") as f:
#     for line in f:
#        print(line.strip())

# with open("t1",mode ="r",encoding="utf-8") as f:
#     lst = f.readlines()
#     print(lst)

# with open("t1",mode ="r",encoding="utf-8") as f:
#     print(f.read(4))

# with open("t1",mode ="r",encoding="utf-8") as f:
#     print(f.readline().strip())

# with open("t1",mode ="r",encoding="utf-8") as f:
#     lst = f.readlines()
#     for i in range(2,len(lst)):
#         print(lst[i].strip())
# 先用readline在for循环
# with open("t1",mode ="a+",encoding="utf-8") as f:
#     f.write("老男孩儿教育")
#     f.seek(0)
#     for line in f:
#         print(line.strip())

# with open("t1",mode ="r+",encoding="utf-8") as f:
#     f.seek(9)
#     f.truncate()
##   f.truncate(9)

 3.文件a.txt内容:每一行内容分别为商品名字,价钱,个数。

  • apple 10 3
  • tesla 100000 1
  • mac 3000 2
  • lenovo 30000 3
  • chicken 10 3

 通过代码,将其构建成这种数据类型:[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。

lis=[]
with open("a",mode ="r",encoding="utf-8") as f:
    for line in f :
        lst = line .strip().split(" ")
        dic ={"name":lst[0],"price":lst[1],"amount":lst[2],}
        lis.append(dic)
sum =0
for i in range(len(lis)):
    sum+=int(lis[i]["price"])*int(lis[i]["price"])
print(sum)

4,有如下文件:

  • tony是创建人。
  • tony其实是人妖。
  • 谁说tonysb?
  • 你们真逗,tony再牛逼,也掩饰不住资深屌丝的气质。

 将文件中所有的tony都替换成大写的SB(文件的改的操作)

import os
with open("4t",mode ="r",encoding="utf-8") as f1,\
     open("4t_副本", mode="w", encoding="utf-8") as f2:
    for line in f1:
        new_line= line.replace("tony","SB")
        f2.write(new_line)
os.remove("4t")
os.rename("4t_副本", "4t")

5.文件a1.txt内容(升级题)

name:apple price:10 amount:3 year:2012
name:tesla price:100000 amount:1 year:2013

.......


通过代码,将其构建成这种数据类型:
[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。

lis=[]
with open("5t",mode ="r",encoding="utf-8") as f:
    for line in f :
        lst1 = line .strip().split(" ")
        # print(lst1)
        dic = {}
        for i in range(0,3):
            [k,v]=lst1[i].split(":")
            dic.setdefault(k, v)
        print(dic)
        lis.append(dic)
print(lis)
sum =0
for i in range(len(lis)):
    sum+=int(lis[i]["price"])*int(lis[i]["price"])
print(sum)

 

5,文件a1.txt内容(升级题)

 序号     部门      人数      平均年龄      备注

1       python    30         26         单身狗
2       Linux     26         30         没对象
3       运营部     20         24         女生多

.......

通过代码,将其构建成这种数据类型:
[{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},
......]

result=[]
with open("6t",mode ="r",encoding="utf-8") as f:
    title = f.readline().strip().split(" ")
    # print(title)
    lis1=[]
    lis2=[]
    for i in range(len(title)):
        if title[i]!="":
            lis1.append(title[i])
    print(lis1)
    for line in f:
        lst=line.strip().split(" ")
        for i in range(len(lst)):
            if lst[i] != "":
                lis2.append(lst[i])
        dic = {lis1[0]: lis2[0], lis1[1]: lis1[1], lis1[2]: lis2[2], lis1[3]: lis2[3], lis1[4]: lis2[4]}
        result.append(dic)
print(result)

注意:其实s.split()什么都不写默认是用空白去切

转载于:https://www.cnblogs.com/wcx666/p/9636553.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值