1.如何获取列表中全部的值?
当我们获取到一个列表,里面含有5个或者更多的值,此时,我们需要取出全部的5个值。可以用一个for循环取出每个元素。
# 获取到症状
item['symptons'] = li.xpath('div/p/a/text()').extract()
#从列表中取出元素,
str=''
for s in item['symptons']:
str=str+s+' '
item['symptons']=str
print('#############')
print(item['symptons'])
2.如何取前两个标签?
有时候我们获取到内容是很多P标签或者其他标签组成,但是我们并不想从第一个标签开始获取内容,此时可以采用以下方法。
#p[position()>1会从第2个p标签开始取值
#/ 儿子
#// 子孙
#p标签后面有2个//,表示取孙子的值,当想取儿子的值,用/
/html/body/section/div[3]/div[1]/div[1]/div[4]/p[position()>1]//text()
3.爬虫如何连续运行多个.py文件
#test1运行完后,会直接运行test2,依次类推
scrapy crawl test1 & scrapy crawl test2 & scrapy crawl test3.........