我有一些代码,对使用BS4提取对数据从一个HTML文件:如何从HTML文件中提取特定数据?
from bs4 import BeautifulSoup
readfile = """
Title1 | TItle2 type | Title3 value1 | Title4 ID value2 |
"""
soup = BeautifulSoup(readfile, "html.parser")
tables = soup.findChildren('table')
for title in soup.find_all("font", {"size": "1"}):
value = title.find_next_sibling("font", {"size": "2"})
print (title.text, ":", value.text if value else "No Value")
比方说,我总共有30行。我只需要4个值对,这样我就可以将它们插入到rdbms中。
我应该尝试使用大小列表:1值我想要的大小:2值?在BS4上查了一些例子,它并没有陷入。 谢谢
2016-04-22
Dave
+0
你想要的输出是什么? –