爬取淘票票上正在热映和即将上映的电影
创建淘票票项目
scrapy startproject taopiaopiao
会在当前目录下创建一个taopiaopiao的目录
taopiaopiao
|--scrapy.cfg 项目部署文件
|--taopiaopiao 对应的python模块
|-- __init__.py
|-- items.py
|-- middlewares.py
|-- pipelines.py
|-- settings.py
|-- spiders
|-- __init__.py
创建爬虫模块
在taopiaopiao/spiders目录下添加一个taopiaopiao_spider.py文件
代码
#coding:utf-8
import scrapy
class taoPiaoPiaoSpider(scrapy.Spider):
#爬虫名称
name = "taopiaopiao"
start_urls = [
"https://www.taopiaopiao.com/showList.htm?n_s=new"
]
def parse(self, response):
#实现网页的解析
movics = response.xpath("//div[@class='movie-card-wrap']")
for movic in movics: