scrapy安装及python大纲

最新推荐文章于 2024-04-21 13:16:33 发布

qq_42266981

最新推荐文章于 2024-04-21 13:16:33 发布

阅读量156

点赞数

本文链接：https://blog.csdn.net/qq_42266981/article/details/80788705

版权

在安装scrapy之前有一些依赖需要安装，否则可能会安装失败，scrapy的选择器依赖于lxml，还有Twisted网络引擎，以下是windows安装:

Scrapy的安装：
1. scrapy需要安装第三方库文件，lxml和Twisted
2. 下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/
3.下载好文件之后，在DOS命令下pip install 文件的位置（lxlm）
安装完成就可以安装：pip install scrapy
还需要安装 win32（启动蜘蛛的时候会提示安装，根据python版本来的我 32位）pip install pypiwin32

1. 初始化scrapy项目

我们可以使用命令行初始化一个项目,（注意创建的路径就是你在命令行下的根目录）

初始化完成后会产生以下文件

scrapy.cfg: 项目的配置文件

tutorial/: 该项目的python模块, 在这里添加代码

items.py: 项目中的item文件

pipelines.py: 项目中的pipelines文件.

settings.py: 项目全局设置文件.

spiders/ 爬虫模块目录

我们可以在dos下执行以下两条命令:

1,Scrapy runspider 要执行的模块名.py -o 要存储的名称.json&.csv&.xml

这个命令是把爬取的内容存储到一个固定文件里，并输入在控制台中

2，scrapy crawl 蜘蛛名

python: tuple list set dict range str 分片 [::] 推导函数：def 函数名称（参数）：实现函数体参数种类：必须参数默认参数关键参数可变参数：tuple *args dict **kwargs 建议：默认参数一定要在必须参数之后定义，可变参数一定要定义在最后函数种类：外部函数内部函数匿名函数 lambda 装饰函数@ 函数总是要返回的如果没有return None总是被返回面向对象：对象：已存在可被使用的实例万物皆对象模块函数变量类方法都是对象 class：描述其他实例信息的对象方法：用来定义其他实例行为的对象与函数的区别：函数可独立定义和调用方法不能独立定义也不能独立调用 staticmethod classmedthod 属性：定义其他实例特征的对象 stu=Student() stu.jump=lambda x: print("你跳了{o}米".format(x) stu.jump(1.2) 常用模块： re xml.... time socket threading random pickle os sys re os sys xml pickle熟练掌握 pdk --> python sdk 第三方：scrapy pandas numpy plot? scrapy:爬虫框架特点工业化重量级 pyspider urllib xpath:通过path风格的表达式来解析xml html e:/大数据/a

qq_42266981

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy安装及python大纲

在安装scrapy之前有一些依赖需要安装，否则可能会安装失败，scrapy的选择器依赖于lxml，还有Twisted网络引擎，以下是windows安装:Scrapy的安装：1. scrapy需要安装第三方库文件，lxml和Twisted2. 下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/3.下载好文件之后，在DOS命令下pip install ...
复制链接

扫一扫