Scrapy教程——搭建环境、创建项目、爬取内容、保存文件（txt）

最新推荐文章于 2024-08-05 10:37:56 发布

倒着走的码农

最新推荐文章于 2024-08-05 10:37:56 发布

阅读量2.3w

点赞数 7

分类专栏： Scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BuptZhengChaoJie/article/details/49962437

版权

本文是一篇针对Python新手的Scrapy爬虫入门教程，详细介绍了如何从安装Scrapy到创建项目、定义Item、编写Spider爬取并保存网页内容到TXT文件的过程。作者分享了自己学习Scrapy的心得，包括安装Python、配置环境变量、安装Scrapy、创建Scrapy项目、定义数据结构Item、编写爬虫解析网页以及数据保存的步骤。

摘要由CSDN通过智能技术生成

写在前面的话

对于一个python新手，要使用scrapy进行爬虫，简直是抓狂，不过一点一点的啃下来，慢慢的发现也挺有意思的，通过好几天的白天去公司实习，晚上熬夜到凌晨写爬虫，现在将自己的第一次爬虫经历记录下来，以备以后再学习，同时也希望可以帮助到广大热爱爬虫、热爱大数据的人；

就像很多博主一样，这里先大概讲解一下scrapy的入门教程。这里提供一个scrapy的官方中文参考文档：http://scrapy-chs.readthedocs.org/zh_CN/latest/intro/tutorial.html

接下来，我需要写的内容包括以下几个部分（程序员都知道，一切从0开始）：

0、安装scrapy

1、创建一个scrapy项目

2、定义你需要保存的Item

3、编写爬取网站的spider

0、安装scrapy

这里说的安装，主要是指windows，因为博主的电脑是windows10；

1、下载Python2.7，可以在官网下载，这里提供一个http://download.csdn.net/detail/buptzhengchaojie/9522958

2、安装python2.7，然后修改环境变量，博主这里python安装在C:\Python27，所以需要在path里增加C:\Python27\;C:\Python27\Scripts\;

3、查看版本：python --version

4、安装pywin32,可以从官网下载。

5、安装pywin32之后，然后打开命令行，确认pip是否被正确安装，输入pip --version，其实python2.7.9之后，默认是安装了pip；如果没有安装pip，可以百度。博主是使用2.7.10，所以默认安装pip，你可以选择更新pip版本。

最低0.47元/天解锁文章

倒着走的码农

关注

7
点赞
踩
24

收藏

觉得还不错? 一键收藏
28
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 28

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。