新手写二手车网站爬虫,爬卖价和原价,原价以删除线形式放在
下。但是遇到没有标记原价,也就是并没有标签的情况下,会自动把下一个内的信息写入上一条占位。试了用if len()判断,但是毫无效果。。请问这种情况应当如何解决,把没有标签的情况正确提取出来,用“”或“nodata”显示?
网页源代码如下,
同时包含原价与卖价的:
<p class="priType-s">
<em class="tag-red">急售</em>
<em class="tag-yellow">超值</em>
<span>
<i class="fc-org priType">
8.40万
</i>
</span>
<s>17.36万</s>
</p>
没有原价标签的:
<span>
<i class="fc-org priType">
3.70万
</i>
</span>
</p>
代码如下,
import requests
from bs4 import BeautifulSoup
def GetInfo(url):