一个html文档的开始标记,如何在Python中只向HTML文档添加一个开始标记

我正在尝试制作一个自动脚本,从网站下载一个表,然后使用正则表达式取出相关数据。html是

UKRAINEJan-Feb 2016 (e) 1.181 -12 -1,0% -71 -5,7% -42 -3,4% EU-28Jan-Feb 201625.045 +1.779 +7,6% +1.559 +6,6% +2.743 +12,3%

到目前为止,我的代码可以得到

的第一部分,包括前3个值,即乌克兰、2016年1月-2月和1.18。但是正如您所看到的,由于html页面上的一个错误,在下一节中没有停止我的程序的打开标记。有没有办法只在那个位置插入一个开始的标记,目前我只能让BeautifulSoup用这个代码在 标记周围插入一个开始和结束标记。你知道吗soup = BeautifulSoup(webpage,'html.parser')

a= soup.find("a", attrs={"href":"index.php?section=consegne"})

tr = soup.new_tag('tr')

a_idx = a.parent.contents.index(a)

a.parent.insert(a_idx , tr)

这给了我以下信息

EU-28

总之,我需要有人帮我把一个opening

标记移到标记之外,如果没有,那就只做一个opening 标记和一个opening 标记。你知道吗
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值