#python爬虫实战，爬取学校排名

最新推荐文章于 2024-04-29 21:26:07 发布

.Passion

最新推荐文章于 2024-04-29 21:26:07 发布

阅读量389

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43923045/article/details/108610920

版权

Python爬虫专栏收录该内容

21 篇文章 0 订阅

订阅专栏

在这里插入图片描述

import requests
from bs4 import BeautifulSoup
import bs4
target = "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html"


def start_page(url,callback):
    resp = requests.get(url)
    callback(resp.content)

def printHtml(text):
    soup = BeautifulSoup(text, "html.parser")
    # print(soup)
    table = soup.find('tbody')
    list = []
    for tr in table.find_all('tr'):
        if isinstance(tr ,bs4.element.Tag):
            tds = tr('td')
            list.append([tds[0].string,tds[1].string,tds[3].string])
    print("大学排名   大学名字  分数")
    for school in list:
        print("{}     {}      {}" .format(school[0],school[1],school[2]))


start_page(target,callback=printHtml)

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

.Passion CSDN认证博客专家 CSDN认证企业博客

码龄6年

594: 原创

2万+: 周排名

221万+: 总排名

43万+: 访问

: 等级

7938: 积分

2631: 粉丝

109: 获赞

81: 评论

414: 收藏

私信

关注

热门文章

分类专栏

golang 25篇
hadoop 1篇
mongodb 1篇
etcd 1篇
rust 1篇
位运算 3篇

最新评论

暴力题#枚举总结
悲催小程序员: 实际答案里需要在计算res时，再补漏一次：上一次的左边界和这次左边界直接的区间，如果这个区间大于3就要加一次这个区间内的组合。这样逻辑才对的上
暴力题#枚举总结
悲催小程序员: 不对，下一个差额不一定就是n-1，去重不对。
暴力题#枚举总结
悲催小程序员: 好像去重算法以后就剩这个了。
暴力题#枚举总结
悲催小程序员: 请问为什么是c（2，n）呢，不是组合里选3个吗？虽然选了三个还需要去重。
jdk 1.8 recursiveTask 的使用
.Passion: 肯定不同姓，只不过是 l字母开头

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。