python读取文件筛选特定信息_python-用正则表达式筛选文本信息

最新推荐文章于 2023-04-13 12:52:55 发布

weixin_39805883

最新推荐文章于 2023-04-13 12:52:55 发布

阅读量931

点赞数 1

文章标签： python读取文件筛选特定信息

【摘要】本文主要介绍如何对多个文本进行读取，并采用正则表达式对其中的信息进行筛选，将筛选出来的信息存写到一个新文本。

打开文件：open(‘文件名’，‘打开方式’)>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错，在文件名的引号前加个r.

文件打开方式：只读——r或rt,rb为二进制文件；打开文件前清空文件内容——w或wt；在文末写入——a+；

清空内容然后在文末写入——w+；写到文件任意位置——r+;

关闭文件：文件打开运行好后必须要关闭——文件名.close()>>>mytxt.close()

读取文件中的内容：将每行内容，包括换行符，作为一个元素存入数组——lines=file_object.readlines()，但是这样会把换行符也赋进去

去除换行符——new_lines=lines.splitlines()

os包：import os 获取文件地址——os.listdir(父文件地址)

1 #coding: utf-8

2 #读取文本中的中英文数据并使用正则表达式将所需数据筛选入到一个新文本中

3 importre4 importos5

6 #zhengze函数对读取到的数据进行筛选，并将筛选好的数据存入数组new_lines

7 new_lines=[] #申明new_lines数组

8 defzhengze(f):9 regex_str=".*?(l.*?e).*"

10 for x inf:11 new_x = x.splitlines() #注意：splitlines是将传入的字符串去除'\n'之后以数组的形式传出，而不是字符串形式

12 match_obj=re.match(regex_str,new_x[0])13 ifmatch_obj:14 new_lines.append(match_obj.group(1))15 else:16 new_lines.append('no')17 returnnew_lines18

19 #获取指定文件夹下的所有文本的绝对地址，并存入数组file_path

20 path=r'C:\Users\yuanlei\Desktop\new_file_txt'

21 file_path=[]22 for filename in os.listdir(path): #获取path下所有文件的路径

23 file_path.append((os.path.join(path,filename)))24 printfile_path25

26 #对每个文本调用正则函数进行筛选,筛选过后的数据存入数组final

27 for adress infile_path:28 file_object=open(adress)29 lines = file_object.readlines( ) #将文本中的内容以数组的形式（每行为一个元素）赋给lines

30 file_object.close()31 final=zhengze(lines)32 printfinal33

34 #将筛选出来的数据写入新文本re_new.txt

35 file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')36 for x infinal:37 file_2.write(x)38 file_2.write('\n')39 file_2.close()

weixin_39805883

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python读取文件筛选特定信息_python-用正则表达式筛选文本信息

【摘要】本文主要介绍如何对多个文本进行读取，并采用正则表达式对其中的信息进行筛选，将筛选出来的信息存写到一个新文本。打开文件：open(‘文件名’，‘打开方式’)>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错，在文件名的引号前加个r.文件打开方式：只读——r或rt,rb为二进制文件；打开文件前清空文件内容——w或wt...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。