数据采集时,多个同类型网页上字段种类、数量可能不一致。有时需要我们判断该字段是否在网页上,使用xpath可以用标签包含某个文本的方式。
部分代码如下:
在不知道Checks for plagiarism字段是否存在的情况下,可以用
try:
pq = doc.xpath("//p[contains(text(),'Checks for plagiarism')]")[0]
except Exception as e:
pq = ''
数据采集时,多个同类型网页上字段种类、数量可能不一致。有时需要我们判断该字段是否在网页上,使用xpath可以用标签包含某个文本的方式。
部分代码如下:
在不知道Checks for plagiarism字段是否存在的情况下,可以用
try:
pq = doc.xpath("//p[contains(text(),'Checks for plagiarism')]")[0]
except Exception as e:
pq = ''