python实现html超链接,我怎样才能从使用Python的HTML获得href链接？

最新推荐文章于 2024-03-23 15:50:57 发布

李巧林

最新推荐文章于 2024-03-23 15:50:57 发布

阅读量1.1k

点赞数

文章标签： python实现html超链接

试试Beautifulsoup ：from BeautifulSoup import BeautifulSoup import urllib2 import re html_page = urllib2.urlopen("http://www.yourwebsite.com") soup = BeautifulSoup(html_page) for link in soup.findAll('a'...

摘要由CSDN通过智能技术生成

试试Beautifulsoup ：

from BeautifulSoup import BeautifulSoup import urllib2 import re html_page = urllib2.urlopen("http://www.yourwebsite.com") soup = BeautifulSoup(html_page) for link in soup.findAll('a'): print link.get('href')

如果你只想要以http://开头的链接，你应该使用：

soup.findAll('a', attrs={'href': re.compile("^http://")})

您可以使用HTMLParser模块。

代码可能看起来像这样：

from HTMLParser import HTMLParser class MyHTMLParser(HTMLParser): def handle_starttag(self, tag, attrs): # Only parse the 'anchor' tag. if tag == "a": # Check the list of defined attributes. for name, value in attrs: # If href is defined, print it. if name == "href": print name, "=", value parser = MyHTMLParser() parser.feed(your_html_string)

注意：在Python 3.0中，HTMLParser模块已经重命名为html.parser。 2to3工具将自

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李巧林

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python实现html超链接,我怎样才能从使用Python的HTML获得href链接？

试试Beautifulsoup ：from BeautifulSoup import BeautifulSoup import urllib2 import re html_page = urllib2.urlopen("http://www.yourwebsite.com") soup = BeautifulSoup(html_page) for link in soup.findAll('a'...
复制链接

扫一扫