我第一次来这里。谢谢你帮了我们这么久。直截了当地说:
场景:
我正在开发一个现有的程序,它将CSS选择器作为一个字符串从配置文件中读取,从而使程序具有动态性,并且能够通过更改CSS选择器的配置值来废弃任何站点。在
问题:
我正在尝试抓取一个网站,它正在渲染项目作为以下两个选项之一:
选项1:.........
$299
$195
soup = soup.select("span.price") - this doesn't work as I need second span tag or last span tag :(
选项2:
^{pr2}$
问题:
在以上两个选项中,我希望能够得到最后一个span标签($195或$199),而不关心$299。基本上我只想提取最终销售价格,而不是原价。在
所以我现在知道的两种方法是:
1)始终获取最后一个量程标记
2) 始终获取没有样式属性的span标记
现在,我知道not运算符,最后一个类型在bs4中不存在(只有nth类型的可用),所以我被困在这里了。任何建议都是有帮助的。在
编辑:-因为这是一个现有的程序,我不能使用汤。找到所有()或除汤。选择(). 对不起:(
谢谢!在