使用scrapy抓取传智播客c/c++讲师信息

最新推荐文章于 2024-08-04 13:54:17 发布

Happy_change

最新推荐文章于 2024-08-04 13:54:17 发布

阅读量488

点赞数

分类专栏：课程学习记录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Happy_change/article/details/110436127

版权

实验一、scrapy爬虫

一、实验目的

1、数据抓取之网络爬虫。
2、scrapy的使用方法，能使用scrapy抓取网页数据。

二、能力图谱

三、实验内容

1.内容：爬取传智播客C/C++讲师的姓名、职称以及个人简介。
2.目标网址：http://www.itcast.cn/channel/teacher.shtml
3.软件：已经成功安装好scrapy框架的pycharm软件 (专业版、社区版都可以)。
4.python3.7及以上。
5.使用scrapy框架实现爬虫，运用xpath解析方式。

四、实验过程

1、pycharm的卸载与安装

       自己之前在自己的笔记本上安装过专业版的pycharm，但是现在激活码过期了，在网上没能找到免费可用的激活码，同时自己以前安装的pycharm的版本不是最新的，所以选择了卸载重装。
关于卸载：
       有了以前重装软件出现的冲突的经验，为了防止重新安装最新社区版pycharm时出现冲突，要将pycharm卸载干净，网上找到了相关卸载方法:pycharm卸载
关于安装：
       为了避免软件安装后的出现的一些由于安装方式的错误，同样找了相关教程：pycharm安装教程

2、scrapy安装

按照老师上课讲解完成安装，结果如下：

3、创建scrapy项目工程

这里我直接进入scrapy的路径运行cmd是在命令行进行创建的，如下图：

3V`QGDTKDBJOLBWZKT1.png
创建完成后使用pycharm打开项目，如图：

4、创建写爬虫的文件

7

5、编写代码

5.1 itcast.py<

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
使用scrapy抓取传智播客c/c++讲师信息

实验一、scrapy爬虫一、实验目的1、数据抓取之网络爬虫。2、scrapy的使用方法，能使用scrapy抓取网页数据。二、能力图谱三、实验内容1.内容：爬取传智播客C/C++讲师的姓名、职称以及个人简介。2.目标网址：http://www.itcast.cn/channel/teacher.shtml3.软件：已经成功安装好scrapy框架的pycharm软件 (专业版、社区版都可以)。4.python3.7及以上。5.使用scrapy框架实现爬虫，运用xpath解析方式。四
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。