Python之正则表达式入门

最新推荐文章于 2022-12-18 19:04:02 发布

coder_mckee

最新推荐文章于 2022-12-18 19:04:02 发布

阅读量368

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/LeeWanzhi/article/details/78385197

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

突然想整理一下以前学的比较重要的东西。趁吃饭前，把正则表达式整理下吧。(谨适用于入门)

一、如何查找关键词

格式：关键词，如there或There
输出：所有包含关键词的句子

import re
handle = open('example.txt')
for line in handle:
    line = line.strip()
    if re.search('there|There',line):
        print line

result：
这里写图片描述

二、首先如何按照”句首”来获取所需信息

格式：^关键词，如^There
输出：所有开头为关键词的句子

import re
handle = open('example.txt')
for line in handle:
    line = line.strip()
    if re.search('^There',line):
        print line

result：
这里写图片描述

前两项是比较基础的，可以在获取信息后再进行后续字符串的处理。

三、re字符的介绍

|：或
^：表示开头
.：表示任意字符
*：表示任意个数
eg:

import re
handle = open('example.txt')
buf = []
for line in handle:
    line = line.strip()
    if re.search('^.*way.*',line):
        print line
        '''
    y = re.findall('^.*way.*',line)
    if len(y)>0:
        buf.append(y)
print buf
'''

用findall()也可以
result:
这里写图片描述

\S: 任意非空格字符
+：任意个数(但至少一个)
？: 0个或1个
{n}：n为常数，代表几个个数，如[0-9]{3}表示3个数字
{a,b}:a个到b个之间
{a,}: 至少a个
如果把上面的改为

if re.search('^.*way.+',line):

则结果为：看看有什么不同
这里写图片描述

‘[0-9]’: 数字
‘[a-zA-Z]’:字母
‘[a-zA-Z0-9]’:字母或数字
‘[0-9.]’: 数字或.
‘[0-9.]+’: 如0.84
规律：[]里面放什么都行，比如 [#][.]
$:结束，如’,$’ 以逗号结束
\ $: ‘$’字符
eg:

import re
handle = open('example.txt')
buf = []
for line in handle:
    line = line.strip()
    if re.search('[a-z]+[#]',line):
        print line

result:
这里写图片描述

四、字符串中提取所需字符

这是重点
主要用到re.findall()
这里写图片描述

如图，提取英文字符、提取数字。

本文讲的比较浅，谨适用于入门，后续还得大家发挥自己的聪明才智融汇贯通。

coder_mckee

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python之正则表达式入门

突然想整理一下以前学的比较重要的东西。趁吃饭前，把正则表达式整理下吧。(谨适用于入门)一、如何查找关键词格式：关键词，如there或There 输出：所有包含关键词的句子import rehandle = open('example.txt')for line in handle: line = line.strip() if re.search('there...
复制链接

扫一扫

专栏目录