python正则匹配单词和字符

最新推荐文章于 2024-04-03 09:07:28 发布

`AllureLove

最新推荐文章于 2024-04-03 09:07:28 发布

阅读量4.3k

点赞数 1

分类专栏： python环境配置文章标签：正则表达式 python

本文链接：https://blog.csdn.net/weixin_36488653/article/details/117744930

版权

python环境配置专栏收录该内容

25 篇文章 3 订阅

订阅专栏

匹配所有单词比较好用的：

r"\w'+"
r"[a-zA-Z]+"

匹配所有标点符号：

r"[^0-9A-Za-z\u4e00-\u9fa5]"

匹配所有单词以及标点符号，并返回列表，但是都有点问题，不过我已经找到了解决办法如下：

import re
strs =  "Hello, I'm a string!"
pat1 = r"\S*"
print(re.findall(pat1, strs)) 
# 输出结果
# ['Hello,', '', "I'm", '', 'a', '', 'string!', '']

pat2 = r"[A-Za-z_0-9]*"
print(re.findall(pat2, strs)) 
# 输出结果
# ['Hello', '', '', 'I', '', 'm', '', 'a', '', 'string', '', '']

pat3 = r"[\w']+|[.,!?;]"
print(re.findall(pat3, strs))
# 输出结果
# ['Hello', ',', "I'm", 'a', 'string', '!']
# 但是这种方法存在缺陷

pat4 = r"[\w\']+|[^0-9A-Za-z\u4e00-\u9fa5]"
print(re.findall(pat3, strs))
# 输出结果，完美解决问题
# ['Hello', ',', ' ', "I'm", ' ', 'a', ' ', 'string', '!']

匹配一个文件中两个标识符号之间的文本：

file1 = open("file1.txt", 'r', encoding="utf-8")
file1 = file1.read()
"""
key1
1235
----
125615
key2
---
15625
"""
key1 = "key1"
key2 = "key2"
pat1 = re.compile(key1 + '(.*?)' + key2, re.S)
res = pat1.findall(file1)[0]
print(res)
"""
1235
----
125615
"""

提取指定字符串之后的全部内容：

print(re.findall('(?<=key).*$', "adnkanddo0key"))
#

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

`AllureLove

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

〖Python语法进阶篇⑩〗- 正则表达式的字符匹配

易编橙 · 终身成长社群，相遇已是上上签！

04-15

4万+

在上一章节我们对正则表达式有了一个比较宏观的认识，并且知道了正则表达式的主要功能是通过匹配规则来获取或者验证字符串中的数据。要想成功的进行字符串的匹配需要使用到正则表达式模块，正则表达式匹配规则以及需要被匹配的字符串。在这三个条件中，模块与字符串都是准备好的，只有匹配规则异常的灵活，而今天这个章节就是认识一下正则表达式中的特殊字符，通过这些字符就可以针对我们想要的数据进行匹配。

python正则匹配字符串_python re正则匹配过滤指定字符串

weixin_39553705的博客

11-24

1606

python re.sub 正则表达式过滤指定字符实例代码re.sub(pattern, repl, string, count=0, flags=0)Return the string obtained by replacing the leftmost non-overlapping occurrences of pattern in string by the replacement rep...

参与评论您还未登录，请先登录后发表或查看评论

python3 正则表达式 匹配多个单词 字符串

whatday的专栏

04-22

7343

“\b”是正则表达式的一个元字符（Metacharacter），代表着单词的开头或结尾，也就是单词的分界处。匹配单词需要使用到它。匹配单个单词只要在单词的头尾分别加上“\b”元字符就可以了，以匹配“span”单词为例： \bspan\b 匹配多个单词： \b(a|strong|img)\b 实例： import re result = "hello world." if ...

python算法之单词模式匹配

sjjsaaaa的博客

06-03

1200

单词模式匹配首先给定两个字符串，一个是单词模式字符串，以恶是目标字符串。之后检查目标字符串是否为给定的单词模式，即求目标字符串中单词出现的规律是否符合单词模式字符串中的规律。例如：单词模式字符串为“一二二一”，目标字符串为“苹果香蕉香蕉苹果”，二者的规律一样，匹配成功。首先建立哈希表来存储数据，由于不仅需要排除一个模式对应多个字符串的情况，还需要排除多个模式对应一个字符的情况，我们需要建立两个哈希表：hash和used。 hash用来存储模式字符串和目标字符串的对应关系，used记录目前已经使用

Python算法系列-单词匹配模式【hash练习】

TianYao

04-13

1538

单词匹配模式一、问题描述二、涉及知识点三、问题分析四、代码构建五、运行调试一、问题描述给定两个字符串，一个是单词模式字符串，另一个是目标字符串。之后检查目标字符串是否为给定得单词模式，即求目标字符串中单词出现的规律是否和单词模式字符串中的规律相同。例如：单词模式字符串为“—二二一”，目标字符串为“苹果香蕉香蕉苹果"，二者得规律一样，匹配成功。二、涉及知识点三、问题分析四、代码构建 d...

正则表达式匹配一个单词

乐趣是人为构建的，构建是一种莫大的乐趣。

02-10

6090

比如我想匹配result,但是文中有许多results,这时就需要用到\b来表示单词的前后边界：

python里使用正则表达式搜索单词

大坡3D软件开发

09-23

3825

在python里有强大的正则表达式模块re，用来它进行模式匹配是非常方便的，比如下面的例子，就是用来从一段文字里查找一个单词，如下：import re pattern = 'this' text = 'http://blog.csdn.net/caimouse is great, this is great way!' match = re.search(pattern, text) s =

正则表达式和字符串处理

weixin_34211761的博客

01-07

350

正则表达式和字符串处理来源 https://www.cnblogs.com/helloczh/articles/1648029.html 第一章 正则表达式概述 正则表达式(Regular Expression)起源于人类神经系统的研究。正则表达式的定义有以下几种： l 用某种模式去匹配一类字符串的公式，它主要是用来描述字符串匹配的工具。 l 描述了...

python编写正则表达式匹配单词_Python正则表达式匹配整个单词

weixin_39627430的博客

11-30

754

我认为操作人员所期望的行为并不是通过给出的答案完全实现的。具体来说，布尔值的期望输出没有完成。给出的答案有助于说明这一概念，我认为它们是优秀的。也许我可以说明我的意思，我认为OP使用了下面的例子。给出的字符串是a = "this is a sample"操作人员接着说I want to match whole word - for example match "hi" should return ...

Python正则表达式匹配字符串中的数字

10-15

“\b”在正则表达式中表示一个单词的边界，它可以用来匹配任何单词字符（字母、数字、下划线）与非单词字符之间的位置。因此，使用“r"\b\d+\b"”可以匹配位于单词边界之间的数字序列。这里，“r”前缀用于指定...

python 如何匹配列表中某个单词_Python正则表达式匹配整个单词

weixin_39664995的博客

11-30

1260

我认为，通过给出的答案，OP所期望的行为并没有完全实现。具体来说，布尔值的期望输出没有完成。给出的答案做帮助说明这一概念，我认为他们是优秀的。也许我可以说明我的意思，我认为OP使用了下面的例子。给出的绳子是，a = "this is a sample"“任择议定书”接着说，我想匹配整个单词-例如匹配"hi"应该回来False自"hi"不是一个词.。据我所知，引用的是搜索标记，"hi"正如世界上所发...

python 如何匹配列表中某个单词_Python中部分指定单词的最佳匹配项

weixin_39942992的博客

02-09

769

如果要重复执行此操作，应创建一个索引：wordlist = [word.strip() for word in "run, ran, rat, rob, fish, tree".split(',')]from collections import defaultdictclass Index(object):def __init__(self, wordlist=()):self.trie = d...

用正则表达式匹配文章中所有的单词

08-02

1408

1.在javascript中： var str=‘int year = 2018;System.out.println(year + "不是闰年")'; str.match(/[a-zA-Z]+/ig); //结果["int", "year", "System", "out", "println","year "] 2.在java中： Pattern p = Pattern.compil...

Python中如何利用正则检索单词、搭配和句型

henanlion的博客

04-03

1042

正则表达式功能强大，但是需要使用支持正则表达式的工具才能检索。支持正则表达式的工具有AntConc, Emeditor, Editpad, PowerGrep，EditPlus等语料库软件和文本处理软件。我们这里在设置软件时，提前加了\b，而在其它软件中则有可能需要加\b。学习正则推荐下载EditPad。我们检索过的语料都是通过提前处理的，把所有句子都断开后，转化为json格式文件才可以供Python软件检索。

python 词库匹配_正则表达式只匹配整个单词

weixin_39630813的博客

12-08

730

使用\b可以产生令人惊讶的结果。你最好弄清楚是什么把一个词从它的定义中分离出来，并把这些信息整合到你的模式中。#!/usr/bin/perluse strict; use warnings;use re 'debug';my $str = 'S.P.E.C.T.R.E. (Special Executive for Counter-intelligence,Terrorism, Revenge a...

关于Python正则表达式中单词边界匹配的问题

sinat_38371226的博客

03-20

864

我们都知道，Python中边界匹配用的是’\b’，那么如下的正则应该能匹配出‘tag’字符串。 re.findall(r'\btag\b', '带tag#tag内容#') 实际上呢，这是不行的。原因是，Python的正则匹配，使用了和C语言一样的规则，即**’\w’不仅包含数字、字母、下划线，还包含unicode的许多汉字**（Java和JS则不包含汉字）。而Python的边界匹配，本质上就是判断边界处是否为’\w’，如果是，则成为边界。所以在上述代码中，‘tag’前后的‘带’、‘内’不被视为单词边界

正则匹配 或者整个单词

Dailoge的博客

12-21

6269

像本地开发中经常需要匹配localhost和127.0.0.1 我们就可以使用: /(localhost|127.0.0.1)/.test(location.hostname) 这里用括号代表一个整体，如果用的中括号[]，就是别的意思了 /[localhost|127.0.0.1]/.test(location.hostname) 这个代表只要可以匹配中括号的任意一个字符就好了，包...

正则：\b 匹配出一个单词的小天使

PocketKnife

08-21

1994

引用自网上 \b 是正则表达式规定的一个特殊代码（也有人称为元字符，metacharacter），代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标点符号或者换行来分隔的，但是 \b 并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置。更精确的说法是： \b 匹配这样的位置：它的前一个字符和后一个字符不全是(一个是,一个不是或不存在) \w。注：\w 匹配字母或数字或下划线简单来说，使用\b是为了匹配一个单词的开头是在哪里开始，结尾是在哪里结束。在这里不得不提到两个位

Python正则表达式

挨踢二天才

03-26

1081

Python正则表达式是一种强大的工具，用于在字符串中查找和匹配特定模式的文本。我们可以使用re模块来使用正则表达式，并且可以使用一些基本的语法来构建正则表达式。这些语法可以帮助我们在字符串中快速查找和匹配特定模式的文本。正则表达式可以在很多场景中使用，例如验证输入，搜索和替换文本等。

python正则匹配特殊字符