Scrapy教程——搭建环境、创建项目、爬取内容、保存文件(txt)

本文是一篇针对Python新手的Scrapy爬虫入门教程,详细介绍了如何从安装Scrapy到创建项目、定义Item、编写Spider爬取并保存网页内容到TXT文件的过程。作者分享了自己学习Scrapy的心得,包括安装Python、配置环境变量、安装Scrapy、创建Scrapy项目、定义数据结构Item、编写爬虫解析网页以及数据保存的步骤。
摘要由CSDN通过智能技术生成

写在前面的话

         对于一个python新手,要使用scrapy进行爬虫,简直是抓狂,不过一点一点的啃下来,慢慢的发现也挺有意思的,通过好几天的白天去公司实习,晚上熬夜到凌晨写爬虫,现在将自己的第一次爬虫经历记录下来,以备以后再学习,同时也希望可以帮助到广大热爱爬虫、热爱大数据的人;

         就像很多博主一样,这里先大概讲解一下scrapy的入门教程。这里提供一个scrapy的官方中文参考文档:http://scrapy-chs.readthedocs.org/zh_CN/latest/intro/tutorial.html

      接下来,我需要写的内容包括以下几个部分(程序员都知道,一切从0开始):

0、安装scrapy

1、创建一个scrapy项目

2、定义你需要保存的Item

3、编写爬取网站的spider

0、安装scrapy

          这里说的安装,主要是指windows,因为博主的电脑是windows10;

1、下载Python2.7,可以在官网下载,这里提供一个http://download.csdn.net/detail/buptzhengchaojie/9522958

2、安装python2.7,然后修改环境变量,博主这里python安装在C:\Python27,所以需要在path里增加C:\Python27\;C:\Python27\Scripts\;

3、查看版本:python --version

4、安装pywin32,可以从官网下载。

5、安装pywin32之后,然后打开命令行,确认pip是否被正确安装,输入pip --version,其实python2.7.9之后,默认是安装了pip;如果没有安装pip,可以百度。博主是使用2.7.10,所以默认安装pip,你可以选择更新pip版本。

  • 7
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 28
    评论
评论 28
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值