【python】指定抓有表格网站的内容

最新推荐文章于 2024-05-19 23:31:32 发布

weixin_46119920

最新推荐文章于 2024-05-19 23:31:32 发布

阅读量78

点赞数

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46119920/article/details/129272973

版权

自动抓取有表格的网站

#### lur目标网址  n1是从table第几个  n2确定好的table中的第几个tr

#基础运行条件需要安装的库
from urllib.request import urlopen  # 打开网址
from bs4 import BeautifulSoup  # 载入bs4的库 需要安装lxml库配合

### 自定义函数体
def zhao(url, n1, n2):
    url = url
    Ceng1_x = n1 - 1
    Ceng1 = 'table'
    Ceng2_x = n2 - 1
    Ceng2 = 'tr'
    url = BeautifulSoup(urlopen(url).read(), 'lxml').find_all(Ceng1)[Ceng1_x].find_all(Ceng2)[Ceng2_x:]
    JiHe = {}
    for v in url:
        JiHe[v.find_all('td')[0].text] = v.find_all('td')[2].text
    return JiHe

### 打印一下 
print(zhao('https://www.boc.cn/sourcedb/whpj/', 2, 2))

weixin_46119920

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【python】指定抓有表格网站的内容

封装了个函数库用于自动抓取有表格的网址指定的内容
复制链接

扫一扫

weixin_46119920 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

168万+: 周排名

190万+: 总排名

1107: 访问

: 等级

70: 积分

1: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

分类专栏

处理表格 1篇

最新评论

【python】抓取指定网站的内容 lxml格式
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
xlwings 常用精简罗列
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/613844700。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。