Python爬虫抓取（一）

qiuxueming_csdn

于 2018-03-19 17:56:02 发布

阅读量330

点赞数 2

分类专栏：爬虫数据分析文章标签：爬虫数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiuxueming_csdn/article/details/79615059

版权

爬虫数据分析专栏收录该内容

1 篇文章

订阅专栏

对于python环境的不做介绍，网上有很多的教程，可以供大家参考，这里主要写一下，我自己最近学习遇到的一些流程和问题：

打开cmd： 1. 新建虚拟环境virtualenv+环境名称，主要是我们开发一个项目，不可能在源目录下进行开发，新建虚拟目录可以不污染源环境，可以切换到你需要新建的目录下再建，默认在python的安装目录下

2.进入虚拟环境 cd+环境名称

3.激活虚拟环境 Scripts\activate

4.在虚拟环境中安装基本的框架：pip install scrapy(必须先安装Twisted 用pip install + Twisted所在的位置（我们自己在网上找的twisted文件）)

5.在虚拟环境中新建scrapy项目：scrapy startproject +名称

6.建立要抓取的网站（这里cmd会有提示的）： cd+ 第5步建立的项目名称

scrapy genspider +自己设置的名称+网站的ip地址

7.抓取内容：scrapy crawl + 设置的名称(先安装win32：pip install pypiwin32）

8.然后打开pycharm中关闭代码setting中的遵循robots协议

9．在虚拟环境中安装mysql驱动：pip install mysqlclient

10. 在pycharm中调试不方便，可以使用scrapy shell + 爬虫名称来调试

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。