爬虫入门之大学排名定向爬取

最新推荐文章于 2024-08-23 16:53:34 发布

运气超好的锦鲤。

最新推荐文章于 2024-08-23 16:53:34 发布

阅读量242

点赞数

文章标签： python

本文链接：https://blog.csdn.net/qq_43566596/article/details/105720388

版权

本文记录了一位初学者使用Python爬虫抓取中国大学排名时遇到的挑战，包括网页内容乱码问题和处理'NavigableString'对象错误。通过实践，学习了如何解决类型错误并提取所需信息。

摘要由CSDN通过智能技术生成

中国大学排名定向爬取

刚接触爬虫，记录一下爬取大学排名时遇到的问题。

爬取url：http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html
爬取思路：
    从网络上获取大学排名网页内容
    提取网页内容中信息到合适的数据结构
    利用数据结构展示并输出结果

先附上代码～

import requests
from bs4 import BeautifulSoup
import bs4

res = requests.get('http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html')
res.encoding = 'utf-8'
demo = res.text
soup = BeautifulSoup(demo,'html.parser') #解析HTML界面，给出待解析内容以及解析器
tag1 = soup

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

运气超好的锦鲤。

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
爬虫入门之大学排名定向爬取

中国大学排名定向爬取刚接触爬虫，记录一下爬取大学排名时遇到的问题。爬取url：http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html爬取思路：从网络上获取大学排名网页内容提取网页内容中信息到合适的数据结构利用数据结构展示并输出结果先附上代码～import requestsfrom bs4 import ...
复制链接

扫一扫