Python----使用正则re取出文本中特定字符串X后面多少位的字符串;取特定字符串与其后多少位字符串。去重列表数据,取有某个字符串这行所有数据

本文介绍了如何使用Python的re模块从大型文本文件中提取特定字符串后面的指定长度内容,并展示了去重列表数据的方法。通过示例代码和运行情况,详细解析了正则表达式的应用以及针对含有特定字符串的行提取完整数据的技巧。
摘要由CSDN通过智能技术生成

Python----使用正则re取出文本中特定字符串X后面多少位的字符串;取特定字符串与其后多少位字符串。去重列表数据,取有某个字符串这行所有数据

提取样本的文件:PMSWeb.2017-12-04.log.1(非常大文件129Mb)

 

2017-12-04 13:52:21,062 [http-apr-9080-exec-29] [INFO]-[com.*****.*****.*****.service.member.impl.MemberControlServiceImpl queryMemberControl 155]-查询会员扩展性控制记录!
2017-12-04 13:52:21,076 [http-apr-9080-exec-38] [INFO]-[com.*****.*****.*****.web.action.drawtransfer.DrawTransferAction getDrawTransferTitle 402]-SessionId=933B6DF242DC88D186848CD5B509D5EC,DrawTransferAction getDrawTransferTitle start
.............................
..........................
...........................
2017-12-04 15:57:49,472 [http-apr-9080-exec-7] [INFO]-[com.*****.*****.*****.comm.ManageFilter blacklistValidate 386]-ManageFilter.blacklistValidate end
2017-12-04 15:57:49,474 [http-apr-9080-exec-7] [INFO]-[com.*****.*****.*****.web.action.member.MemberAction isSupportFinance 3675]-SessionId=7B29CCCBDB2F2DFDF8EAE6D2BA3BB929,MemberAction.isSupportFinance start


例子1:使用正则re取出文本中特定字符串X后面多少位的字符串

脚本文件

 

root@kali:~/python/dinpay# cat findlogsessionid.py 
#!/usr/bin/python
# --*-- coding:utf-8 --8--
import re

sourcesessionis = open("/root/python/dinpay/PMSWeb.2017-12-04.log.1").read()
temp = sourcesessionis.decode("utf8")
reg = r'SessionId=(.{32})'#只取SessionId=字符后面32位字符串
wordreg = re.compile(reg)
wordreglist = re.findall(wordreg,temp)
for word in wordreglist:
	print word加班

脚本运行情况

 

6767B50A9DB30F556302EB5E21C05239
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681E4FB598D587077CF1
6767B50A9DB30F556302EB5E21C05239
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681E4FB598D587077CF1
9A8F272AAD8A681
  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

徐为波

看着给就好了,学习写作有点累!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值