张謹礧
在校大学生一枚,希望大家可以多多交流,多多关照,备战考研,一起上岸
展开
-
python——实例:中国大学排名定向爬虫
调用打印大学排名信息的函数,并打印排名前30的大学信息原创 2023-06-11 17:36:24 · 944 阅读 · 2 评论 -
python爬虫——pandas的简单使用
pandas作为爬虫中最重要的包之一,我们要想学好爬虫,就必须要深入了解pandas直接上代码原创 2023-05-28 09:56:35 · 456 阅读 · 0 评论 -
python爬虫——爬取某电影Top250
这是一个爬取某电影Top250并将数据写入CSV文件的Python程序。原创 2023-05-28 10:09:03 · 403 阅读 · 0 评论 -
简单的爬虫程序——爬某网站英雄皮肤
python作为一个比较出名的语言,它最强大的功能之一就是爬虫在这里我将教你们一个简单的爬虫小程序,爬取皮肤原创 2023-05-26 21:51:36 · 78 阅读 · 0 评论 -
一个简单的爬虫(爬取网址关键信息)
【代码】一个简单的爬虫(爬取网址关键信息)原创 2023-05-22 22:50:07 · 186 阅读 · 0 评论 -
python爬虫基础知识——新手小白必入
Python是免费的、开源的、跨平台、面向对象、 执行方式: 1.交互式----测试环境 2.文件式----实际生产场景 Python是一门解释型编程语言、使用一种特殊的编译方法,编译之后得到pyc文件 Python源代码----> 编译----> 字节码-----> 解释-----> 机器码 编译核心是提高速度,解释是为了跨平台原创 2023-05-26 22:16:05 · 89 阅读 · 0 评论 -
python网络爬虫——爬取网络关键字信息
这段代码使用了requests库和BeautifulSoup库来获取并解析搜狗搜索结果页面中的标题信息。具体的步骤如下:导入所需的库:requests和BeautifulSoup。定义了一个函数get_search_results(),用于获取关键字的搜索结果。构造搜索关键字的URL,将关键字拼接到URL中。设置请求头信息,包括User-Agent。使用requests库的get()方法发送HTTP请求,并获取相应的内容。检查响应状态码是否为200,如果是则表示请求成功,使用Beautiful原创 2023-10-30 20:01:26 · 1777 阅读 · 0 评论 -
python网络爬虫——爬取人民邮电出版社新书推荐信息
这段代码是一个爬取人民邮电出版社新书推荐信息的程序。它使用requests库发送HTTP请求,获取新书列表和每本书的详细信息,然后将数据保存到Excel文件中。具体的步骤如下:导入所需的库:requests、json和openpyxl。定义了一个URL变量,用于发送GET请求获取新书推荐列表的数据。设置请求头信息,包括User-Agent和Cookie。使用requests库的get()方法发送HTTP请求,并将响应内容解析为JSON格式。定义了一个函数save_excel(),用于创建Exce原创 2023-10-30 19:58:50 · 914 阅读 · 0 评论 -
python网络爬虫——爬取新发地农产品数据
这段代码是一个爬取新发地蔬菜价格信息的程序,它使用了多线程来加快数据获取和解析的速度。具体的步骤如下:导入所需的库:json、requests、threading和pandas。初始化一些变量,包括页数、商品总列表以及存放json数据的列表。定义了一个函数url_parse(),用于发送请求并解析网页数据。函数使用requests.post()方法发送POST请求,获取商品信息,并将其保存到jsons列表中。定义了一个函数json_parse(),用于解析json数据并将商品信息保存到商品总列表c原创 2023-10-30 19:54:58 · 1331 阅读 · 4 评论 -
爬取豆瓣图书网站的图书信息,并生成xlsx文档
这段代码是一个用来爬取豆瓣图书信息的脚本。脚本首先定义了两个函数:get_url和get_data,分别用于获取分页网址和采集数据。然后在if __name__ == "__main__":部分,脚本通过调用这两个函数来爬取数据。首先调用get_url函数获取了10个分页网址,然后使用get_data函数依次采集每个分页的数据。最后将采集到的数据存入pandas的DataFrame,并将其保存为Excel文件。需要注意的是,代码中使用了requests和Beautif原创 2023-10-30 19:46:43 · 804 阅读 · 0 评论