提取html中特定,如何从HTML文件中提取特定数据？

简单心理Uni

于 2021-06-17 09:07:23 发布

阅读量561

点赞数

文章标签：提取html中特定

我有一些代码，对使用BS4提取对数据从一个HTML文件：如何从HTML文件中提取特定数据？

from bs4 import BeautifulSoup

readfile = """

Title1

TItle2 type

Title3

value1

Title4 ID

value2

"""

soup = BeautifulSoup(readfile, "html.parser")

tables = soup.findChildren('table')

for title in soup.find_all("font", {"size": "1"}):

value = title.find_next_sibling("font", {"size": "2"})

print (title.text, ":", value.text if value else "No Value")

比方说，我总共有30行。我只需要4个值对，这样我就可以将它们插入到rdbms中。

我应该尝试使用大小列表：1值我想要的大小：2值？在BS4上查了一些例子，它并没有陷入。谢谢

2016-04-22

Dave

+0

你想要的输出是什么？ –

简单心理Uni

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
提取html中特定,如何从HTML文件中提取特定数据？

我有一些代码，对使用BS4提取对数据从一个HTML文件：如何从HTML文件中提取特定数据？from bs4 import BeautifulSoupreadfile = """Title1TItle2 typeTitle3value1Title4 IDvalue2"""soup = BeautifulSoup(readfile, "html.parser")tables = soup.fi...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。