自动去除空格的html 代码,Python:在解析html代码时跳过行,去掉空格

我有以下html代码:html_doc = """

API guidance for developers

Images

Score descriptors

Downloadable XML data files (updated daily)

East Counties

East Midlands

London

North East

North West

South East

South West

West Midlands

Yorkshire and Humberside

Northern Ireland

Scotland

Wales

"""

如何跳过前四行并访问诸如East Counties等文本字符串?你知道吗

我的尝试没有跳过前四行,而是返回字符串包括代码中嵌入的许多空格(我想去掉这些空格):from bs4 import BeautifulSoup

soup = BeautifulSoup(html_doc, 'html.parser')

for h2 in soup.find_all('h2'):

next

next

next

next

print (str(h2.children.next()))

预期结果:East Counties

East Midlands

London

North East

...

我做错什么了?你知道吗

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值