微软面试题：正则表达式提取链接地址

最新推荐文章于 2024-10-15 19:38:08 发布

weixin_33871366

最新推荐文章于 2024-10-15 19:38:08 发布

阅读量166

点赞数

文章标签： python 面试

写出正则表达式，从一个字符串中提取链接地址。比如下面字符串中
"IT面试题博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微软面试题> 微软面试题 </a> "
则需要提取的地址为 " http://hi.baidu.com/mianshiti/blog/category/微软面试题 "

在python中：
import re
p = re.compile('<a(?: [^>]*)+href=([^ >]*)(?: [^>]*)*>')
content = "IT面试题博客中包含很多 <a href=http://hi.baidu.com/mianshiti/blog/category/微软面试题> 微软面试题 </a> "
p.search(content).groups()
这段代码对于给出的例子是足够了，但实际情况中还需要考虑链接地址两边的单引号或者双引号，href的大小写，情况会稍微复杂些。
另外，如果面试者对正则表达式完全没有概念，可以和面试官申请换一道题，一般不会有太大影响。
参考资料：
http://wiki.ubuntu.org.cn/Python正则表达式操作指南

weixin_33871366

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。