一个很简单的问题:xpath定位不到想要得到的数据,实际上就是我们表面上看到的网页格式并不是真实的网页格式,举例说明:点击查看网页 这个网页,先建立好爬虫项目,起好爬虫的名字,这里爬虫名字就为:test.py.
用google浏览器打开链接,右击检查,然后Ctrl+F键,找到我们像定位的地方,进行定位搜索:“//*[@id=‘menu’]/following-sibling::table/tbody/tr[2]/@onclick”
可以看到,已经找到了定位信息,然后再test.py中进行编写:
import scrapy
class KeywordSpider(scrapy.Spider):
name =