这个网页中,一个<tr>里面有两个<td>,在爬取时
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
a = soup.find('table',class_='text12').findAll("tr")
for i in a:
tds = i("td") # 不能用tr.attrs["td"] 因为这是个列表了 而不是BeatutifulSoup类型的数据了
#ulist.append([tds[0].string,tds[1].string])
ulist.append([tds[1].string])
可以通过数组下标来控制
ulist.append([tds[1].string])就代表只要第二个数据
即:formaldehyde,甲醛,ISO 765 这些数据
同理,输出时,亦可以控制:
def printUnivList(ulist, num):
#tplt = "{0:^10}\t{1:^10}"
tplt = "{0:^10}\t"
for i in range(num):
u = ulist[i]
#print(tplt.format(u[0].encode("utf-8"), u[1].encode("utf-8"), chr(255)))
print(tplt.format(u[0].encode("utf-8"), chr(255)))