我正在尝试制作一个自动脚本,从网站下载一个表,然后使用正则表达式取出相关数据。html是
UKRAINEJan-Feb 2016 (e) 1.181 -12 -1,0% -71 -5,7% -42 -3,4% EU-28Jan-Feb 201625.045 +1.779 +7,6% +1.559 +6,6% +2.743 +12,3%到目前为止,我的代码可以得到
的第一部分,包括前3个值,即乌克兰、2016年1月-2月和1.18。但是正如您所看到的,由于html页面上的一个错误,在下一节中没有停止我的程序的打开标记。有没有办法只在那个位置插入一个开始的标记,目前我只能让BeautifulSoup用这个代码在 标记周围插入一个开始和结束标记。你知道吗soup = BeautifulSoup(webpage,'html.parser')a= soup.find("a", attrs={"href":"index.php?section=consegne"})
tr = soup.new_tag('tr')
a_idx = a.parent.contents.index(a)
a.parent.insert(a_idx , tr)
这给了我以下信息
EU-28总之,我需要有人帮我把一个opening
标记移到标记之外,如果没有,那就只做一个opening 标记和一个opening 标记。你知道吗