正则表达式匹配超链接解决方案

正则表达式匹配超链接
想把下载的网页中的所有超链接全部删除,例如hi<a href="www.baidu.com">baidu</a>world
最后只剩hiworld
想这么用 (c++的正则库,但是在那个板块问没人回答,在这里问问(*^__^*))

 regex linkexp("<a.*?>.*?</a>");
  string body = regex_replace(inbody,linkexp," ");


regex linkexp("<a\\s*?>.*?</a>");

上面两个都试过,对于一些网页可以,但是有些网页就会报错,c++抛出异常,上网查询说是正则表达式有歧义导致,匹配产生NP完全问题才会停止的,不知道该怎么修改,查了很多资料都找不到原因

------解决方案--------------------
试一试:regex linkexp("<a\s+href.*?a>");
------解决方案--------------------
试试这个"<a[^>]+>[^>]*?</a>"
------解决方案--------------------
把报错的那个网页的HTML代码贴点给我们测试一下
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值