这是小甲鱼视频中的一个练习题,大概要求是
题目
#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:
#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)
#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)
#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割
可以看到我自己创建的talk.txt内容如下
效果
先看一下完成后的效果
把原有的txt切分成了6个文件,每个文件单独保存对应的话语
未优化的代码
大部分的注意事项与说明我都写在了注释当中
#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:
#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)
#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)
#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割)
f = open('talk.txt','r', encoding='UTF-8')
listA = []
listB = []
count = 1
for each_line in f:
if each_line[:6] != '======': # 切割前几个等号即可
(role,line_spoken) = each_line.split(':',1) # split以:进行字符切割,切割一次,这里注意txt中的符号是中文符号还是英文符号
# 将切得到的两部分内容依次存放在role与line_spoken中
if role == 'A作者':
listA.append(line_spoken) # A作者的内容添加到列表A中
if role == 'B作者':
listB.append(line_spoken) # B作者的内容添加到列表B中
else:
# 遇到等号,进行文件保存操作
file_name_A = 'A_' + str(count) + '.txt'
file_name_B = 'B_' + str(count) + '.txt'
A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
B_file = open(file_name_B,'w') # 并贴上B_file的标签
A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
B_file.writelines(listB)
A_file.close() # 关闭A_file文件
B_file.close()
listA = [] # 清空列表
listB = []
count += 1
# 循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
file_name_A = 'A_' + str(count) + '.txt'
file_name_B = 'B_' + str(count) + '.txt'
A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_boy命名的txt文件
B_file = open(file_name_B,'w') # 并贴上B_file的标签
A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
B_file.writelines(listB)
A_file.close() # 关闭A_file文件
B_file.close()
f.close()
这里的主要思想是
1、打开我们建立好的txt文件,分别以listA、listB保存A作者、B作者的说话内容,count用以计数。
2、遍历文件中的每一行,在没有遇到段落分割符号’====='时,将每一行以冒号进行分割,分割成作者名称与说话内容两部分,说话内容部分推进list当中
3、遇到段落分隔符等号部分时,创建新的txt文件,以count计数命名
4、用writelines() 方法向文件中写入一序列的字符串(之前保存的listA、listB)。
5、关闭文件。
6、循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
7、关闭文件
ps
这里记录一下遇到的小问题
1、python读取文件时提示
解决方法:
f = open('talk.txt','r', encoding='UTF-8')
后来查询到还有一种解决方法
f = open('talk.txt','rb')
2、split分割时的符号问题
这里是因为我txt中采用的中文符号,而程序里用的英文符号进行分割,导致出错
优化的代码
这里的优化其实只是把创建新文件,写入对话内容,关闭文件这部分内容封装到一个具体的函数中,然后进行重复调用,总体思想和上述内容一模一样,分割文件的方法也放在一个具体的函数中,然后进行调用。
# 简化版本,将命名与说话内容写入文件单独写进一个方法进行重复调用
#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:
#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)
#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)
#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割)
# 创建新文件,写入对话内容,关闭文件
def save_file(listA, listB, count):
file_name_A = 'A_' + str(count) + '.txt'
file_name_B = 'B_' + str(count) + '.txt'
A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
B_file = open(file_name_B,'w') # 并贴上B_file的标签
A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
B_file.writelines(listB)
A_file.close() # 关闭A_file文件
B_file.close()
# 分割文件
def spilt_file(file_name):
f = open(file_name,'r', encoding='UTF-8')
listA = []
listB = []
count = 1
for each_line in f:
if each_line[:6] != '======': # 切割前几个等号即可
(role,line_spoken) = each_line.split(':',1) # split以:进行字符切割,切割一次,这里注意txt中的符号是中文符号还是英文符号
# 将切得到的两部分内容依次存放在role与line_spoken中
if role == 'A作者':
listA.append(line_spoken) # A作者的内容添加到列表A中
if role == 'B作者':
listB.append(line_spoken) # B作者的内容添加到列表B中
else:
# 遇到等号,进行文件写入、保存操作
save_file(listA, listB, count)
listA = [] # 清空列表
listB = []
count += 1
# 循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
save_file(listA, listB, count)
f.close()
spilt_file('talk.txt')