选取本节的父节点的兄弟节点

最新推荐文章于 2022-10-24 08:46:10 发布

黄大黄

最新推荐文章于 2022-10-24 08:46:10 发布

阅读量379

点赞数

文章标签： xpath python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38413844/article/details/107048354

版权

只能说找了2个小时 xpath牛逼 css如果出个选择父节点的属性的就好了

import  requests
from bs4 import BeautifulSoup
import lxml
from lxml import html
from html.parser import HTMLParser
url='https://www.qidian.com/all?orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=0&page=1'
c=requests.get(url)
soup=lxml.etree.HTML(c.text)
tree=soup.xpath("//li[@class='lbf-pagination-item']/a[@class='lbf-pagination-page  lbf-pagination-current']/../following-sibling::li[1]")
# 转为string
print(len(tree))
for i in range(len(tree)):
    tree1 = html.tostring(tree[i])
    # 编码'utf-8'
    tree2 = HTMLParser().unescape(tree1.decode('utf-8'))
    print(tree2)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
选取本节的父节点的兄弟节点

只能说找了2个小时 xpath牛逼 css如果出个选择父节点的属性的就好了import requestsfrom bs4 import BeautifulSoupimport lxmlfrom lxml import htmlfrom html.parser import HTMLParserurl='https://www.qidian.com/all?orderId=&style=1&pageSize=20&siteid=1&pubflag=0&
复制链接

扫一扫

黄大黄 CSDN认证博客专家 CSDN认证企业博客

码龄7年

20: 原创

75万+: 周排名

52万+: 总排名

2万+: 访问

: 等级

439: 积分

12: 粉丝

14: 获赞

12: 评论

39: 收藏

私信

关注

最新评论

知网的爬取很简单
qq_43542275: 我可以帮忙爬取
知网的爬取很简单
liubo68945: 大佬你好，我是一个编程小白，看了这个教程然后在python上也不知道如何运行复制的代码。我需要在知网爬取某一期刊历年来所有的论文的题目，关键字和专题类别，请问要怎么做？
知网的爬取很简单
黄大黄: 最近也尝试过新版的知网爬取知网的封禁还是挺强的是按ip封的建议搞一个ip池就行了 url跟着F12 一步一步找就可以了
知网的爬取很简单
00goto: 这是基于旧版的知网吧?博主有爬新版的吗？能不能指导一下分析URL变化啊
知网的爬取很简单
黄大黄回复 LuLu997339219: 基本上就这些啊大兄弟多看看参数传递应该都可以爬取呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。