Python 爬虫(以赛马数据为例)之使用BeautifulSoup进行Html解析

一、BeautifulSoup的使用

find()方法和find_all()方法:find()方法查找第一个符合条件的,find_all()方法所有符合条件的,find()的结果相当于find_all()[0]。

例如,

查找所有的<td>标签:tds = soup.find_all("td")

查找第十个<td>标签: tds[9]

连续查找:find()和find_all()可以连续使用:table = tds[9].find("table").find_all("td")

查找指定属性的标签:

lines1 =tableElement.find_all(class_="trBgGrey")

trs = soup.find(class_="bigborder").find(cellspacing="1").find_all("tr")

获取父节点自己的(不包含子节点的)内容

<td class="divWidth">第四班 -<span class="number14">1000米 -(60-35)</span></td>

获取【第四班】

         tableElement1[0].find("td").contents[0].strip()



 

获取find_all()结果中的最后一个

         tableElement1[0].find_all("td")[-1].get_text()

 

去掉find_all()结果中的前几个元素

trs = trs[3:]



最后贴上

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值