正则基础知识(断言)

[size=medium]一、单词边界的匹配
使用\b能匹配单词边界,在\b所在的一边不是单词字符,单词字符的解释是\w能匹配的字符。例如:
print re.findall(r"\b\w+\b", "a sentence\tcontains\na lot of words")
# =>['a', 'sentence', 'contains', 'a', 'lot', 'of', 'words']

单词边界匹配的是某个位置而不是文本,这类匹配位置的元素叫做锚点,常用的锚点还有^和$
如果要匹配整个字符串的起始位置,也可以匹配换行符之后的位置,最简单的办法是在正则表达式前加(?m)。例如:
string = "first line\nsecond line\r\nlast line"
lineBeginWordRegex = r"(?m)^\w+"
print re.findall(lineBeginWordRegex, string)
# =>['first', 'second', 'last']

^和$的替换
plainText = "line1\nline2\nline3"
print re.sub(r"(?m)$", "</p>", re.sub(r"(?m)^", "<p>", plainText))
# => <p>line1</p>
<p>line2</p>
<p>line3</p>

使用r"(?m)^\s+"去除行首的空白字符,使用r"(?m)\s+$"去除行尾的空白字符
withSpace = " begin\n between\t\n\nend"
beginSapceRegex = r"(?m)^\s+"
trimmedLeadingSpace = re.sub(beginSapceRegex, "", withSpace)
print trimmedLeadingSpace
# =>
begin
between
end[/size]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值