python基础学习-文件操作（打开文件，切分后保存为新文件）

最新推荐文章于 2024-08-11 03:13:49 发布

小夭。

最新推荐文章于 2024-08-11 03:13:49 发布

阅读量780

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/m0_47146037/article/details/120563198

版权

python 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

这是小甲鱼视频中的一个练习题，大概要求是

题目

#任务：将文件（talk.txt）中的数据进行分割并按照以下规律保存起来：

#–A作者的对话单独保存为A_*.txt的文件（去掉“A作者:”）

#–B作者的对话单独保存为B_*.txt的文件（去掉“B作者:”）

#–文件中总共有三段对话，分别保存为A_1.txt, B_1.txt，A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件（提示：文件中不同的对话间已经使用“==========”分割

可以看到我自己创建的talk.txt内容如下
在这里插入图片描述

效果

先看一下完成后的效果
在这里插入图片描述
把原有的txt切分成了6个文件，每个文件单独保存对应的话语

未优化的代码

大部分的注意事项与说明我都写在了注释当中

#任务：将文件（talk.txt）中的数据进行分割并按照以下规律保存起来：

#–A作者的对话单独保存为A_*.txt的文件（去掉“A作者:”）

#–B作者的对话单独保存为B_*.txt的文件（去掉“B作者:”）

#–文件中总共有三段对话，分别保存为A_1.txt, B_1.txt，A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件（提示：文件中不同的对话间已经使用“==========”分割）

f = open('talk.txt','r', encoding='UTF-8')

listA = []
listB = []
count = 1

for each_line in f:
  if each_line[:6] != '======': # 切割前几个等号即可
     (role,line_spoken) = each_line.split('：',1) # split以:进行字符切割，切割一次，这里注意txt中的符号是中文符号还是英文符号
     # 将切得到的两部分内容依次存放在role与line_spoken中
     if role == 'A作者':
       listA.append(line_spoken) # A作者的内容添加到列表A中
     if role == 'B作者':
       listB.append(line_spoken) # B作者的内容添加到列表B中
  else:
    # 遇到等号，进行文件保存操作
    file_name_A = 'A_' + str(count) + '.txt'
    file_name_B = 'B_' + str(count) + '.txt'
    
    A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
    B_file = open(file_name_B,'w') # 并贴上B_file的标签

    A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
    B_file.writelines(listB)

    A_file.close() # 关闭A_file文件
    B_file.close()

    listA = [] # 清空列表
    listB = []
    count += 1

  # 循环是以等号为判断条件，这样的话，最后一段文字结束没有等号的话，需要单独对最后一段文字进行处理（处理方法直接重复调用上述else部分）
  file_name_A = 'A_' + str(count) + '.txt'
  file_name_B = 'B_' + str(count) + '.txt'
  
  A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_boy命名的txt文件
  B_file = open(file_name_B,'w') # 并贴上B_file的标签

  A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
  B_file.writelines(listB)

  A_file.close() # 关闭A_file文件
  B_file.close()

f.close()

这里的主要思想是
1、打开我们建立好的txt文件，分别以listA、listB保存A作者、B作者的说话内容，count用以计数。
2、遍历文件中的每一行，在没有遇到段落分割符号’====='时，将每一行以冒号进行分割，分割成作者名称与说话内容两部分，说话内容部分推进list当中
3、遇到段落分隔符等号部分时，创建新的txt文件，以count计数命名
4、用writelines() 方法向文件中写入一序列的字符串（之前保存的listA、listB）。
5、关闭文件。
6、循环是以等号为判断条件，这样的话，最后一段文字结束没有等号的话，需要单独对最后一段文字进行处理（处理方法直接重复调用上述else部分）
7、关闭文件

ps

这里记录一下遇到的小问题
1、python读取文件时提示
在这里插入图片描述

解决方法：

f = open('talk.txt','r', encoding='UTF-8')

后来查询到还有一种解决方法

f = open('talk.txt','rb')

2、split分割时的符号问题
在这里插入图片描述
这里是因为我txt中采用的中文符号，而程序里用的英文符号进行分割，导致出错

优化的代码

这里的优化其实只是把创建新文件，写入对话内容，关闭文件这部分内容封装到一个具体的函数中，然后进行重复调用，总体思想和上述内容一模一样，分割文件的方法也放在一个具体的函数中，然后进行调用。

# 简化版本，将命名与说话内容写入文件单独写进一个方法进行重复调用

#任务：将文件（talk.txt）中的数据进行分割并按照以下规律保存起来：

#–A作者的对话单独保存为A_*.txt的文件（去掉“A作者:”）

#–B作者的对话单独保存为B_*.txt的文件（去掉“B作者:”）

#–文件中总共有三段对话，分别保存为A_1.txt, B_1.txt，A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件（提示：文件中不同的对话间已经使用“==========”分割）

# 创建新文件，写入对话内容，关闭文件
def save_file(listA, listB, count): 
  file_name_A = 'A_' + str(count) + '.txt'
  file_name_B = 'B_' + str(count) + '.txt'
  
  A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
  B_file = open(file_name_B,'w') # 并贴上B_file的标签

  A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
  B_file.writelines(listB)

  A_file.close() # 关闭A_file文件
  B_file.close()

# 分割文件
def spilt_file(file_name):
  f = open(file_name,'r', encoding='UTF-8')

  listA = []
  listB = []
  count = 1

  for each_line in f:
    if each_line[:6] != '======': # 切割前几个等号即可
      (role,line_spoken) = each_line.split('：',1) # split以:进行字符切割，切割一次，这里注意txt中的符号是中文符号还是英文符号
      # 将切得到的两部分内容依次存放在role与line_spoken中
      if role == 'A作者':
        listA.append(line_spoken) # A作者的内容添加到列表A中
      if role == 'B作者':
        listB.append(line_spoken) # B作者的内容添加到列表B中
    else:
      # 遇到等号，进行文件写入、保存操作
      save_file(listA, listB, count)

      listA = [] # 清空列表
      listB = []
      count += 1

    # 循环是以等号为判断条件，这样的话，最后一段文字结束没有等号的话，需要单独对最后一段文字进行处理（处理方法直接重复调用上述else部分）
    save_file(listA, listB, count)

  f.close()

spilt_file('talk.txt')