学习笔记(22):150讲轻松搞定Python网络爬虫-bs4-find和find_all方法

立即学习:https://edu.csdn.net/course/play/24756/280700?utm_source=blogtoedu

:1、’find_all:返回的是一个列表

from bs4 import BeautifulSoup

html="""   """

soup = BeautifulSoup(html,"lxml")

(1)获取所有tr标签

trs=soup.find_all('tr')

for tr in trs:

     print(tr)

     print('-'*50)

(2)获取第2个tr标签:

tr=soup.find_all('tr',limit=2)[1]

print(tr)

(find_all('tr',limit=2)表示前两个)

(3)获取所有class=even的tr标签:

trs=soup.find_all('tr',class_='even')(class_是为了避免class重复,报错)

or trs=soup.find_all('tr',attrs={'class':'even'})

(4)将所有id=test,class=test的a标签提取出来:

list=soup.find_all('a',id='test',class_='test')

for a in list:

    print(a)

(5)获取所有a标签的href属性:

alist=soup.find_all('a')

for a in alist:

    href=a['href']

    print(href)

或者:

for a in alist:

    href=a.attrs['href']

    print(href)

(6)获取所有职位信息,纯文本

trs=soup.find_all('tr')[1:]

for tr in trs:

    tds=tr.find_all('td')

    name=tds[0].string

    print(name)

或者:

infos=list(tr.stripped_strings)

print(infos)

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值