python只保留数据的某几列_从BeautifulSoup,python中的表(td)中仅提取特定的行和列?...

我想从网站上抓取数据并将其写入CSV。示例代码包含“列名称”和“值”。

Number

CODE

Name

Category

Variation

3259

ABC123

LAND

3 - Design Reference

2 - Production Item

Number 3259 - Reference Number ABC123

CODE ABC123

3260

XYZ453

WATER

3 Control Reference

2 Item

输出应该是我使用它时来自First'td'标签的列名

from bs4 import BeautifulSoup soup = BeautifulSoup(open('code.html'),'lxml') col = soup.find('tr').find_all('td') for c in col: print(c.get_text())

所有列都打印出来。相反,我只需要,

['Number', 'Code', 'Name']

我不需要'tr'包含“colspan” (第3个tr)

同时删除最后两列值,

tr = soup.findChildren('tr') for t in tr: td = t.findChildren('td') for child in td: print(child.text)

再次,我得到包括列和值的整个数据,我期望的是

['3259', 'ABC123', 'LAND'] and ['3260', 'XYZ453','WATER']

通过去除

['3 - Design Reference','2 - Production Item']

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值