Scrapy核心原理_实验

微__凉

已于 2023-08-29 14:13:51 修改

阅读量750

点赞数

分类专栏：习题集文章标签： scrapy python 开发语言

于 2022-09-13 11:26:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Qian280101/article/details/126830015

版权

习题集专栏收录该内容

22 篇文章 19 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文档引导读者学习Scrapy的核心原理，并提供一个实战任务，要求编写一个Scrapy爬虫，该爬虫需能运行并把网页内容保存到`baidu.html`文件中。任务涉及到在`world.py`文件的`parse()`函数中补充代码，以实现爬取内容并保存到相对路径的HTML文件。完成任务后，平台会检查`baidu.html`文件的生成及其内容是否符合预期。

摘要由CSDN通过智能技术生成

任务描述
本关任务：学习 Scrapy 核心原理，并编写一个能够跑通 Scrapy 核心流程的爬虫小程序。
编程要求
根据提示，在右侧编辑器 Begin-End 区间补充代码，完善函数 parse()，将爬取到的网页内容写入文件baidu.html中，保存文件时使用相对路径baidu.html。

说明：
函数 parse()属于爬虫文件 world.py 的内容，整个爬虫项目文件结构可以通过点击右上角的文件夹图标查看，如下图所示：
在这里插入图片描述
文件夹展开后，可以看到爬虫项目文件结构如下：
测试说明
平台会检测是否有指定文件名的 HTML 文件生成，并解析文件中的文本是否是符合一定规则的。

开始你的任务吧，祝你成功！

代码文件：src/step2/HelloWorld/HelloWorld/spiders/world.py

# -*- coding: utf-

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Scrapy核心原理_实验

根据提示，在右侧编辑器 Begin-End 区间补充代码，完善函数 parse()，将爬取到的网页内容写入文件baidu.html中，保存文件时使用相对路径baidu.html。代码文件：src/step2/HelloWorld/HelloWorld/spiders/world.py。本关任务：学习 Scrapy 核心原理，并编写一个能够跑通 Scrapy 核心流程的爬虫小程序。平台会检测是否有指定文件名的 HTML 文件生成，并解析文件中的文本是否是符合一定规则的。开始你的任务吧，祝你成功！
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

微__凉 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。