Python爬虫(二)--获取页面元素的href属性

网页中单一类型数据的全部信息:

网页由多种元素组成,一个元素可能有多个属性,例如class,id,name,text,href,value等,本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫(一)

from bs4 import BeautifulSoup  #导入架包
import requests    #导入架包

r=requests.get('https://wuhaozhan.net/') #获取目标网址所有信息
demo=r.text               #定义所有信息的文本
soup=BeautifulSoup(demo,'html.parser')   #BeautifulSoup中的方法
for link in soup.find_all('a'):      #遍历网页中所有的超链接(a标签)
    print(link.get('href'))    #  打印出所有包含href的元素的链接。
  • 11
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值