python html解析beautiful_解析HTML Python,BeautifulSoup

首先,我将示例数据转换为有效的html页面并对其进行了预打印。这样就更容易看到发生了什么:

Thomas A /Dumpling/

event1: 4 February 1940
event2: 9 October 2002
Laplata, Md

然后调换一下你的程序:

^{pr2}$

只留下实际的解析代码def get_string(node, default=''):

if node:

return ', '.join(node.stripped_strings)

else:

return default

def get_data(td_princ):

name = get_string(td_princ.find('span', {'class':'person-link'})).replace('/', '')

birth = hired = '(missing)'

for event in td_princ.find('table', {'class': 'events'}).findAll('tr'):

cnt = [get_string(cell) for cell in event.findAll('td')]

if len(cnt) == 2:

if cnt[0] == "event1:":

birth = cnt[1]

elif cnt[0] == "event2:":

hired = cnt[1]

return (name, birth, hired)

当对示例数据运行时,会生成一个csv文件Name,Born,Hired

Thomas A Dumpling,4 February 1940,"9 October 2002, Laplata, Md"

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值