python爬取div中段落_python爬虫用BeautifulSoup爬取<s>元素并写入字典,但某些div下没有这一元素,导致自动写入下一条,如何解决?...

在爬取二手车网站时,使用BeautifulSoup解析HTML,遇到部分
内没有标签表示原价。当尝试用len()判断时无法解决问题,导致下一条信息填充到当前条目。解决方案是通过修改选择器,确保在没有标签时返回空值,或者使用正则表达式对整个块进行提取,以避免信息错乱。
摘要由CSDN通过智能技术生成

新手写二手车网站爬虫,爬卖价和原价,原价以删除线形式放在

下。但是遇到没有标记原价,也就是并没有标签的情况下,会自动把下一个内的信息写入上一条占位。试了用if len()判断,但是毫无效果。。请问这种情况应当如何解决,把没有标签的情况正确提取出来,用“”或“nodata”显示?

网页源代码如下,

同时包含原价与卖价的:

<p class="priType-s">

<em class="tag-red">急售</em>

<em class="tag-yellow">超值</em>

<span>

<i class="fc-org priType">

8.40万

</i>

</span>

<s>17.36万</s>

</p>

没有原价标签的:

<span>

<i class="fc-org priType">

3.70万

</i>

</span>

</p>

代码如下,

import requests

from bs4 import BeautifulSoup

def GetInfo(url):

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值