说明:txt文件中按行存储了不同的数据。(如下展示)
目的:从文件中取出公司名称。
变更
2021-03-30 16:27:27
2021-03-30 16:27:27
20
深圳市永顺康商贸有限公司
{"…
2021-03-30 16:27:29
2021-03-30 16:27:29
19
深圳市汇百荟科技有限公司
思路:每个数据都是单独存一行的,所以可以利用正则匹配每行以“公司”字样结尾的行,获取文件中的所有公司名。如果匹配就存入到列表中,最后返回列表即可。
import re
# 读取每行结尾是“公司”的行,存入list
# input_file:存储公司名称的文件路径
def get_name_list(input_file):
name_list = []
# 载入并编译正则表达式
pattern = re.compile(r'公司$')
with open(input_file, 'r', encoding='utf-8') as fr:
for line in fr:
# 匹配每行结尾是“公司”的行
match = pattern.search(line)
if match:
name_list.append(line.strip('\n'))
print(name_list)
return name_list