【python】指定抓有表格网站的内容

自动抓取有表格的网站

#### lur目标网址  n1是从table第几个  n2确定好的table中的第几个tr

#基础运行条件需要安装的库
from urllib.request import urlopen  # 打开网址
from bs4 import BeautifulSoup  # 载入bs4的库 需要安装lxml库配合

### 自定义函数体
def zhao(url, n1, n2):
    url = url
    Ceng1_x = n1 - 1
    Ceng1 = 'table'
    Ceng2_x = n2 - 1
    Ceng2 = 'tr'
    url = BeautifulSoup(urlopen(url).read(), 'lxml').find_all(Ceng1)[Ceng1_x].find_all(Ceng2)[Ceng2_x:]
    JiHe = {}
    for v in url:
        JiHe[v.find_all('td')[0].text] = v.find_all('td')[2].text
    return JiHe

### 打印一下 
print(zhao('https://www.boc.cn/sourcedb/whpj/', 2, 2))
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值