- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 xpath获取同级标签
根据业务需要,需要抓取页面详情,很多时候,详情页来自于不同的类型分类,因此页面元素是不一样的 使用following-sibling included_content = selector.xpath('/html/body/div[6]/div[3]/following-sibling::*') #正文 tempcontent="" #循环拼接 for i in ...
2018-10-25 17:08:14 4138 1
原创 scrapy爬虫数据入库后有重复数据
import copy #10创建数据库 def insertProgressReportDrillById(self, item): sql = "insert into rpm_project_progress_fromxy(sum_report_progress,sum_production,proj_code) values(%s,%s,%s)" #对象拷贝,深拷...
2018-10-13 22:33:50 2460
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人