我正在编写一个beauthulsoup/python代码来从html表中获取数据。该表的问题是某些列可能有空白数据(单元格为空)。当我运行这段代码时,当它第一次遇到表中的空白单元格时,它会以一个“类型错误”停止,我只得到直到那行代码为止的输出。在
下面的代码在第一次出现空单元格时因类型错误而停止。在for tr in rows:
cols = tr.findAll('td')
for td in cols:
text = ''.join(td.find(text=True))
以上代码的输出示例-
^{pr2}$
注意,在上面输出的最后一行中,在last value(BB)之后没有数据。这是因为在表中有一个空白单元格,因此python在输出这么多数据后停止运行。在
我试图修改它,但现在它在某些已经有数据的单元格中输入空白。在
更新代码:for tr in rows:
cols = tr.findAll('td')
for td in cols:
if td.find(text=''):
text = ''.join('blank')
else:
text = ''.join(td.find(text=True))
print text + ", ",
以上代码的输出示例-blank, 123, c, d, 6, 0, blank, blank,
blank, 21, b, e, 6, 5, blank, blank,
blank, 1, a, f, 7, 5, blank,
注意-即使在上面的情况下,它在第三个单元格中遇到实际的空白数据后也会停止。在
我做错什么了?我基本上希望单元格输出在单元格没有数据时为空,否则输出应该是实际的单元格内容。在