python re包_使用Python中的re包将句子分成子句

最新推荐文章于 2023-10-30 15:45:35 发布

weixin_39577964

最新推荐文章于 2023-10-30 15:45:35 发布

阅读量167

点赞数

python re包

我有一个很多句子的数据,关于一个例子作为下面的句子,我想把它分成2个子句子：

Both whole plasma and the d < 1.006 g/ml density fraction of plasma

from 2/2 mice show this broad beta-migration pattern (Fig. 1 B)

virtually no lipid staining at the beta-position. |T:**1SN3E3|

|I:**1SN3E3| |L:**1SN3E3|

将它拆分为：

Both whole plasma and the d < 1.006 g/ml density fraction of plasma

from 2/2 mice show this broad beta-migration pattern (Fig. 1 B)

和

in contrast, 3/3 plasma shows virtually no lipid staining at the

beta-position.

我的代码是：

newData =[]

for item in Data:

test2= re.split(r" (?:\|.*?\| ?)+", item[0])

test2 =test2[:-1]

for tx in test2:

newData.append(tx)

print len(newData)

print newData

但是,我在结果中得到了3个项目,包括;我查了一下原来的句子,发现了,在| T：** 1SP3E3 | ; | I：** 1SP3E3 |,所以我需要删除它;从结果出来.我修改了我的代码

test2= re.split(r" (?:\|.*?\| ?;?)+", item[0])

但我无法得到正确的结果.有人可以帮忙吗？非常感谢.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39577964

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python常用模块之re模块

金鞍少年的博客

02-21

745

re模块是python独有的匹配字符串的模块，该模块中提供的很多功能是基于正则表达式实现的，而正则表达式是对字符串进行模糊匹配，提取自己需要的字符串部分，他对所有的语言都通用。

python module docs_告别菜鸟，一文学会Python模块（有深度）

weixin_36367249的博客

01-28

2152

原标题：告别菜鸟，一文学会Python模块(有深度)来源：麦叔编程作者：麦叔Python必备核心技能 - 模块module(内容超详细，举例说明很容易懂)Python模块和包是和变量，函数，类同等重要的基础的基础。因为它们是Python组织程序的方式。掌握不好，你很难学习和理解新的知识，会处处碰壁。是掌握Python必备的核心技能。在硬核Python私教班课程中，我把所有关键技能总结为Pytho...

参与评论您还未登录，请先登录后发表或查看评论

python re模块

weixin_30663391的博客

10-12

156

re正则表达式操作　　本模块提供了类似于Perl的正则表达式匹配操作。要匹配的模式和字符串可以是Unicode字符串以及8位字符串。　　正则表达式使用反斜杠字符('\')来表示特殊的形式或者来允许使用特殊的字符而不要启用它们特殊的含义。这与字符串字面值中相同目的的相同字符的用法冲突；例如，要匹配一个反斜线字面值，你必须写成'\\\\'作为模式字符串，因为正则表达式必须是\\，每个反斜线...

python re包_Python标准库01 正则表达式 (re包)

weixin_29699579的博客

02-19

643

我将从正则表达式开始讲Python的标准库。正则表达式是文字处理中常用的工具，而且不需要额外的系统知识或经验。我们会把系统相关的包放在后面讲解。正则表达式(regular expression)主要功能是从字符串(string)中通过特定的模式(pattern)，搜索想要找到的内容。语法之前，我们简介了字符串相关的处理函数。我们可以通过这些函数实现简单的搜索功能，比如说从字符串“I love yo...

Python 7) 正则表达式(re包)

lhh15991135087的博客

10-21

342

正则表达式则为重点, 正则表达式(regular expression),主要功能是从字符串(String) 中通过特定的模式(pattern),搜索想要找到的内容. 语法前边我们简介了字符串相关的处理函数,我们可以通过这些函数去实现简单的搜索功能,从而搜索想要的内容, 比如说从字符串"Hello World" 中搜索是否有"world"这一子字符

Python正则表达式re包用法

打瞌睡_的博客

07-14

1225

1.常用函数 # 编译 re.compile(pattern, flags=0) # 从字符串任意位置匹配，返回匹配到的第一个 re.search(pattern, string, flags=0) # 从字符串开始匹配，返回匹配到的第一个 re.match(pattern, string, flags=0) # 分割 re.split(pattern, string, maxsplit=0, flags=0) # 可以返回所有匹配结果 re.findall(pattern, string, fla

python mod_告别菜鸟，一文学会Python模块（有深度）

weixin_36301830的博客

02-09

2405

来源：麦叔编程作者：麦叔Python必备核心技能 - 模块module(内容超详细，举例说明很容易懂)Python模块和包是和变量，函数，类同等重要的基础的基础。因为它们是Python组织程序的方式。掌握不好，你很难学习和理解新的知识，会处处碰壁。是掌握Python必备的核心技能。在硬核Python私教班课程中，我把所有关键技能总结为Python 36技，模块和包是其中之一。如果你想快速系统的学习...

python学习整理

qi463222的博客

12-24

477

数据类型字符宽度： {:10d} 右对齐 (默认, 宽度为10) {:<10d} 左对齐 (宽度为10) {:^10d} 中间对齐 (宽度为10) 例子：输出2个字符宽度为7，且保留2为小数 fahrenheit = 0 print(“Fahrenheit Celsius”) while fahrenheit <= 250: celsius = (fahrenheit...

Python基础教程

weixin_50720378的博客

10-29

1076

Python基础教程第一章：基础知识 1.获取用户的输入;input() 2.幂运算：**；pow(x,y[,z])返回x的y次方对Z求模的结果 abs()计算绝对值 round() 将浮点数圆整为与之最接近的数 cmath.sqrt()计算平方根,可用于负数 math.sqrt()计算平方根,不可用于负数 bytes(string,encoding[, errors])对指定的字符串进行编码，并以指定的方式处理错误 math.ceil() 以浮点数的方式返回向上圆整的结果 math.floor() 以

python问题笔记

最新发布

怨行客

10-30

208

GIL 是 Global Interpreter Lock（全局解释器锁）的缩写，是 Python CPython 解释器（Python 的主流实现）中的一个技术术语。GIL 是一个互斥锁，用于在任何时刻只允许一个线程执行 Python 字节码。这意味着在多线程的环境中，即使在多核心的机器上，只有一个线程在给定的时间内被执行。想象你有一个咖啡店，而这家咖啡店只有一个咖啡机。GIL 就像这个咖啡店的规矩：一次只允许一个员工使用咖啡机。

papyrus:将评论分解为句子并对其进行分析的 NLP 引擎

06-03

纸莎草纸将评论分解为句子并对其进行分析的 NLP 引擎

python re包的作用_python re模块详解

weixin_32758601的博客

02-19

2228

re模块re模块使用python拥有全部的正则表达式功能re.complitcompile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换格式：re.match(pattern,string,flags=0) #pattern: 正则模型， string：要匹配的字符串 falgs:匹配模式a = re.complit(r"\d*", ...

python re包的作用_Python之re模块的使用

weixin_39940714的博客

12-22

2581

re模块的作用正则表达式是用一种形式化语法描述的文本匹配模式。模式会被解释为一组指令，然后执行这些指今并提供一个字符串作为输入，将生成一个匹配子集或者生成原字符串的一个修改版本。1、查找文本中的模式，re.search()importrepattern= 'this'text= 'Does this text match the pattern?'match=re.search(pattern, ...

python正则表达式 (re包)

蕃茄炒蛋

07-12

160

官方documentation: https://docs.python.org/2/library/re.html 1、语法 import re m = re.search('[0-9]','abcd4ef') #只返回第一个检索到的结果, 这里返回'4' print(m.group(0)) # == print(m.group()) 2、正则表达式的函数 m = re.se...

python中对正则表达式re包的简单引用

Hadson进击之路

03-26

4496

正则表达式一直是被我所忽略的东西，因为在之前的学习和开发中基本很少用到它。而且，之前学习正则表达式时感觉很懵逼，所以毅然决然的放弃了（QAQ），然而出来混总归还是要还的。最近在弄日志处理时，必须用到正则表达式，这就让我不得不拿起正则表达式了。在此记录一些自己学习的笔记与案例。在python中导入re包import re 一、re.match(pattern,string,flags=0)尝试从字...

正则表达式 python_Python 正则表达式

weixin_39539002的博客

01-24

227

Python 正则表达式作者：杨梦鸽校对：翟舒青正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。r...

Python实现对中文文本分句

weixin_43495948的博客

03-08

8534

问题实现对文本的分句，大致来说主要是以中文的句号、感叹、问号等符号进行分句。难点在于直接分句可能会造成人物说话的语句也被分开！步骤分段首先读取文本，文本读取后整体是一个字符串，每一个段之间是空白，所以分段之间按照空白分开来即可，最后存入一个paragraph_list，注意该list的下标就是段落的顺序号！其他的这里就不再多赘述！（可以查看最后的整体代码）分句首先拿到上面分好的paragraph_list，循环拿到每一段，然后对每一段直接按照分句规则（正则表达式）进行分句，参考该文章 imp

python--json，正则表达式，RE包和函数

Swallow_shangtou的博客

12-12

808

json和 python格式的对应字符串:字符中数字:数字队列:1ist 对象:dict 布尔值:布尔值 python for json: json包 json和 python对象的转换 json,.dumps():对数据编码,把 python格式表示成json格式 json.loads():对数据解码,把json格式转换成 python格式 python读取json文件 ...