python替换指定字符

最新推荐文章于 2024-05-09 06:40:36 发布

forever_44944

最新推荐文章于 2024-05-09 06:40:36 发布

阅读量2.1k

点赞数

分类专栏： python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/forever_44944/article/details/21229693

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

有如下一段文本，要求将中括号[]后的第一个分号;替换为换行符

[Souma, Kousaku;Kanda, Fumie;Masuko, Takayoshi] Tokyo Univ Agr, Fac Bioind, Abashiri, Hokkaido 0992493, Japan;[Wang, Peng] Jgfdsa Univ, Coll Ansfdm Sci & Vet Med, Chanfdsn 130023, Jfdsn, Peoples R China;[Igarashi, Hiroaki] Hokuren Federat Agr Cooperat Assoc, Obihiro Branch Off, Obihiro, Hokkaido, Japan

思路，用正则表达式定位分号位置，用subn替换

a="[Souma, Kousaku;Kanda, Fumie;Masuko, Takayoshi] Tokyo Univ Agr, Fac Bioind, Abashiri, Hokkaido 0992493, Japan;[Wang, Peng] Jgfdsa Univ, Coll Ansfdm Sci & Vet Med, Chanfdsn 130023, Jfdsn, Peoples R China;[Igarashi, Hiroaki] Hokuren Federat Agr Cooperat Assoc, Obihiro Branch Off, Obihiro, Hokkaido, Japan"
pattern=re.compile(r"(\[.*?\].*?)(;)(?=\[)")
pattern.subn(r'\1\n',a)[0]

输出结果：

'[Souma, Kousaku;Kanda, Fumie;Masuko, Takayoshi] Tokyo Univ Agr, Fac Bioind, Abashiri, Hokkaido 0992493, Japan\n[Wang, Peng] Jgfdsa Univ, Coll Ansfdm Sci & Vet Med, Chanfdsn 130023, Jfdsn, Peoples R China\n[Igarashi, Hiroaki] Hokuren Federat Agr Cooperat Assoc, Obihiro Branch Off, Obihiro, Hokkaido, Japan'
注意：

1、在.*后加?禁用贪婪模式，否则只能搜索到最后一个分号

2、subn的意思是将匹配到的串用正则表达式r'\1\n'替换，其中\1即pattern中第一个分组，第二个分组是分号用\n替代

python版本2.7.3

forever_44944

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python替换指定字符

有如下一段文本，要求将中括号[]后的第一个分号;替换为换行符[Souma, Kousaku;Kanda, Fumie;Masuko, Takayoshi] Tokyo Univ Agr, Fac Bioind, Abashiri, Hokkaido 0992493, Japan;[Wang, Peng] Jgfdsa Univ, Coll Ansfdm Sci & Vet Med, Chanf
复制链接

扫一扫