Python:Pycharm如何使用scrapy框架做爬虫?

因为入门python以来一直使用pycharm,所以对着黑白的DOS不习惯,所以此次来实现使用pycharm进行实现使用scrapy框架

①pip install scrapy(首先安装scrapy第三方包) 不会安装的:参考本人另一篇博文:https://blog.csdn.net/YiXiao1997/article/details/96345737

②新建第一个scrapy项目,先cd到想要的目录,然后输入:scrapy startproject PythonScrapy ,就建好了一个项目

打开新建的项目,然后如图:

在项目目录下新建一个start.py用来实现项目的启动

 然后在spider下新建一个Test_spider.py 其中name = "Test_spider"就是爬虫名字,所以在start.py下也启动这个名字

有些网站有反爬虫,所以需要伪装成浏览器,这个时候需要在settings.py中进行设置 ,修改DEFAULT_REQUEST_HEADERS={}

最后直接运行就可以了

 

 

  • 7
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值