关于BeautifulSoup中搜寻标签的问题

使用BeautifulSoup可以完整将一个网页解析成为一个标签树,但是对于其中某个标签的寻找,一般而言可以使用find all()函数和find()函数,但是这两个函数对于参数的使用一定的要求,因此还有一种方式就是使用选择器即select()方法。

soup = BeautifulSoup(html, "html.parser")
sInfo = soup.find_all('div', attrs={'class': 'stock-bets'})
if len(sInfo) != 0:
    name = sInfo[0].find('a', attrs={'class': 'bets-name'}).text.split()
    infoDict.update({'股票名称': name[0]+name[1]})
    keyList = sInfo[0].select('dt')
    valueList = sInfo[0].select('dd')
上述代码中,sInfo[0].select()方法等效于sInfo[0].findall('dt'),但是这种寻找同时也将网页进行了一定的切片,这样的结果就可能对后面的寻找dt标签产生影响(原因是什么,目前还不是很清楚)。但是如果使用select()方法,选择器仅是将选中的结果返回,而不会对原变量地址进行修改,就不会影响后续的使用。(至少目前我认为find all()一定程度上可能会对变量地址产生影响,造成连续findall()函数报错)



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值