使用scrapy抓取传智播客c/c++讲师信息

实验一、scrapy爬虫

一、实验目的

1、数据抓取之网络爬虫。
2、scrapy的使用方法,能使用scrapy抓取网页数据。

二、能力图谱

image.png

三、实验内容

1.内容:爬取传智播客C/C++讲师的姓名、职称以及个人简介。
2.目标网址:http://www.itcast.cn/channel/teacher.shtml
3.软件: 已经成功 安装好scrapy框架 的pycharm软件 (专业版、社区版都可以)。
4.python3.7及以上。
5.使用scrapy框架实现爬虫,运用xpath解析方式。

四、实验过程

1、pycharm的卸载与安装

       自己之前在自己的笔记本上安装过专业版的pycharm,但是现在激活码过期了,在网上没能找到免费可用的激活码,同时自己以前安装的pycharm的版本不是最新的,所以选择了卸载重装。
关于卸载:
       有了以前重装软件出现的冲突的经验,为了防止重新安装最新社区版pycharm时出现冲突,要将pycharm卸载干净,网上找到了相关卸载方法:pycharm卸载
关于安装:
       为了避免软件安装后的出现的一些由于安装方式的错误,同样找了相关教程:pycharm安装教程

2、scrapy安装

按照老师上课讲解完成安装,结果如下:
KZO5JH9HPDL.png
LVGU3F7MN0ZX9E9_5.png

3、创建scrapy项目工程

这里我直接进入scrapy的路径运行cmd是在命令行进行创建的,如下图:
YCD85JJWD4ZSLNORKY0.png
3V`QGDTKDBJOLBWZKT1.png
创建完成后使用pycharm打开项目,如图:
M7D14S65I7K43CGI.png

4、创建写爬虫的文件

image.png
9P6T2FPU_K6CAJ06X28L5.png7

5、编写代码

5.1 itca
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值