scrapy 爬虫框架笔记

最新推荐文章于 2024-05-29 14:13:29 发布

syty2020

最新推荐文章于 2024-05-29 14:13:29 发布

阅读量557

点赞数

文章标签：爬虫 python 开发语言

本文链接：https://blog.csdn.net/dzhou1991/article/details/121162976

版权

分分钟爬网站

初始化项目

开始一个项目叫 myScrapy

scrapy startproject myScrapy
进入目录
cd myScrapy

生成一个baidu的spider
scrapy genspider baidu www.baidu.com 

开始执行这个spider
scrapy crawl baidu

//查看windows历史命令 doskey /history

获取xpath 右键复制xpath

scrapy 各个文件的作用

爬虫名.py

def parse()主要的解析位置

items.py

主要有几个项目

pipeline.py

持久化的地方，可以打印存入文件数据库等

settings.py 【重要】

配置文件

优惠劵

syty2020

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy 爬虫框架笔记

分分钟爬网站初始化项目开始一个项目叫 myScrapyscrapy startproject myScrapy进入目录cd myScrapy生成一个baidu的spiderscrapy genspider baidu www.baidu.com 开始执行这个spiderscrapy crawl baidu//查看windows历史命令 doskey /history获取xpath 右键复制xpathscrapy 各个文件的作用爬虫名.pyd
复制链接

扫一扫