我正在使用BeautifulSoup并解析一些HTML。
我从每个HTML(使用for循环)获取某些数据并将该数据添加到某个列表中。
问题是,一些HTML具有不同的格式(并且它们没有我想要的数据)。
所以,我试图使用异常处理并将值null添加到列表中(我应该这样做,因为数据序列很重要。)
例如,我有一个代码,如:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between
andgotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
并且有些链接没有任何
,所以我想要的是将字符串null添加到列表中。出现错误:
list index out of range.
我尝试过的是添加这样的一些行:
if not dlist[1]:
newlist.append('null')
continue
但它没有成功。 它仍然显示错误:
list index out of range.
我该怎么办? 我应该使用异常处理吗? 或者有更简单的方法吗?
有什么建议? 任何帮助都会非常棒!