爬取目标:爬取某论坛评论中的所有邮箱
首先,创建Scrapy工程和项目
在cmd命令中输入如下命令:
scrapy startproject tianya(工程名)
scrapy genspider mytianya "bbs.tianya.cn"(生成mytianya.py文件)(爬取的域名范围)
在工程目录下生成一个start.py文件,方便程序的运行,并编写一下内容在文件中
import scrapy.cmdline
scrapy.cmdline.execute(['scrapy','crawl','mytianya'])
使用效果等同于在cmd中输入命令: