正则表达式匹配多行文本

今天做爬虫项目要用正则表达式匹配,以前没学过正则表达式,发现正则表达式功能真的是很强大,就用了几个简单的匹配的方式就完成了解析了一个html页面的信息。但是如何匹配多行文本?我首先想到的是用\s*匹配空字符(回车、换行、水平制表符等),然后用.*匹配所以非空字符,发现这样只能够一个段落一个段落的匹配,很不方便。想了一晚上没有想出来,最后搜索到可以开启多行模式(?s),就不要担心这些空格换行了

<span property="v:summary">
                                      《2001太空漫游》后9年,前国家航天委员会主任弗洛伊德博士(罗伊•谢德 Roy Scheider 饰)接受苏美合作计划,带领发现号航天站设计者科脑博士(约翰•利思戈 John Lithgow 饰)和HAL9000电脑的创始人钱德拉博士(鲍勃•巴拉班 Bob Balaban 饰)登录木星附近的苏联航空站,与苏联宇航员卡布珂(海伦•米伦 Helen Mirren 饰)等合作,空中接轨美国发现号航天站,调查九年前的事故原因,探索木卫二的神秘黑石,并查明宇航员大卫•伯曼(凯尔•杜拉 Keir Dullea 饰)缘何神秘失踪。然而任务执行尚未过半,美苏关系愈发紧张,战争一触即发;与此同时,大卫•伯曼竟突然现身对弗洛伊德博士发出神秘警告。
                                        <br>
                                      本片改编自亚瑟•克拉克的小说《2010太空漫游》,获第59界奥斯卡最佳艺术指导—布景,最佳服装设计,最佳视觉效果,最佳化妆...
                            </span>

正则表达式:(?s)<span.*property="v:summary">(.*?)</span>

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值