python利用正则表达式读取文件中指定内容

说明:txt文件中按行存储了不同的数据。(如下展示)
目的:从文件中取出公司名称。

变更
2021-03-30 16:27:27
2021-03-30 16:27:27
20
深圳市永顺康商贸有限公司
{"…
2021-03-30 16:27:29
2021-03-30 16:27:29
19
深圳市汇百荟科技有限公司

思路:每个数据都是单独存一行的,所以可以利用正则匹配每行以“公司”字样结尾的行,获取文件中的所有公司名。如果匹配就存入到列表中,最后返回列表即可。

import re

# 读取每行结尾是“公司”的行,存入list
# input_file:存储公司名称的文件路径
def get_name_list(input_file):
	name_list = []

	# 载入并编译正则表达式
	pattern = re.compile(r'公司$')

	with open(input_file, 'r', encoding='utf-8') as fr:
		for line in fr:
			# 匹配每行结尾是“公司”的行
			match = pattern.search(line)
			if match:
				name_list.append(line.strip('\n'))	
	print(name_list)	
	return name_list
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值