这是max+上一张英雄胜率图
那么我们怎么获取图片中的信息并加以利用呢?
1.编辑定向获取该网页的爬虫,获得上面的“姓名”“胜率”“使用次数”的信息
新建爬虫项目dotaitems:
新建后的scrapy基本框架就是这样子
分别说一下几个部分:
item.py相当于爬取到数据的容器;
name=scrapy.Field()
frequency=scrapy.Field()
wr=scrapy.Field()#win rate
settings是配置文件,需要修改的地方不多;(pipelines默认是关闭的,要打开)
ITEM_PIPELINES = {
‘dotaitems.pipelines.DotaitemsPipeline’: 300,
}
#
maxsearch是爬虫的核心部分,因为只对单个网页操作,所以主要是正则表达式的书写;
item[“name”]=response.xpath(“//span[@class=’hero-name-list