xpath来爬取诗词

菜鸟长安

于 2022-10-01 21:54:06 发布

阅读量177

点赞数

分类专栏：爬虫文章标签： python 开发语言

本文链接：https://blog.csdn.net/zzxzzxking/article/details/127137999

版权

爬虫专栏收录该内容

15 篇文章 1 订阅

订阅专栏

# 爬取中国古诗词网的诗词

import requests
from lxml import etree

url = "http://86gsc.com/"
headers={'User-Agent': 'BaiduSpider'}
res = requests.get(url = url,headers = headers).text
# 访问成功
# print(res.status_code)
# print(res)
tree = etree.HTML(res)   #?什么意思

# xpath返回的值都是以列表的形式来返回的
title = tree.xpath("//p/a/b/text()")      #xpath返回的结果以列表的形式存储
print(title)
authors = tree.xpath("//div/p/a[2]/text()")
print(authors)
concent = tree.xpath('//div[@class="contson"]/text()')       #注意双冒号和单冒号
print(concent)

for t,a,c in zip(title,authors,concent):
    print(t,a,c)
# for i in zip(title,authors,concent):
#     print(i)