爬虫
文章平均质量分 59
ScrapingBoy
这个作者很懒,什么都没留下…
展开
-
爬取最新通知
1.爬取最新通知 要导入的包: from urllib.request import Request from urllib.request import urlopen import urllib.parse import datetime from bs4 import BeautifulSoup 定义解析网址的函数 def get_new_notice(website:str): # 直接使用 urlopen('网址') 返回 404 错误,对方网站设置有反爬原创 2022-03-30 15:04:53 · 157 阅读 · 0 评论 -
爬取某学校官网通知
爬取某学校官网通知 一、爬取网页所有通知 需求:有时候对于学生党来说,每次大考之后,查分数都是特别心急,特别是对于学校官网的通知等,本笔记主要关注这一点,以下是实现内容。 # 使用 urllib 和 BeautifulSoup 库实现 import urllib.request import urllib.parse from bs4 import BeautifulSoup # 一、获取网址中的HTML源代码存储为python list对象 requst = urllib.request.Reques原创 2020-07-18 16:45:55 · 1042 阅读 · 2 评论 -
爬取某高校研究生院最新通知
爬取某高校研究生院最新通知 一、需求描述 近年来高校毕业生激增,就业、升学、考公、创业人数都有所增加,但近年来考研人数也快速增加,万的大关,2020年已突破341万,估计明年会迈进400万的大关,下面我列个近年来的考研人数图,如图1.1、1.2所示。在这里预祝所有考研的同学们都顺利考上自己心仪的高校。话说碰到今年的疫情,各行各个都有影响,咱们的初试、复试时间一再延期,还好线上举办,及有效的防止人员流动造成的疫情的传播、也方便大家的备考、调剂以及时间成本。大家都是初试复试已经过了,就差一个拟录取通知,各高校通原创 2020-07-18 16:21:33 · 326 阅读 · 0 评论