学习xpath

最新推荐文章于 2024-06-16 14:25:13 发布

qq_16241125

最新推荐文章于 2024-06-16 14:25:13 发布

阅读量144

点赞数

本文链接：https://blog.csdn.net/qq_16241125/article/details/88126042

版权

一.使用lxml+xpath提取内容

import requests
from lxml import etree

url=“http://www.dxy.cn/bbs/thread/626626#626626”
page=requests.get(url=url)
html=page.content
real_hxml=etree.HTML(html)

#获取内容
conts=real_hxml.xpath("//td[@class=‘postbody’]/text()")

con=[]
for i in conts:
i=i.strip()
con.append(i)

auths=real_hxml.xpath("//div[@class=‘auth’]/child:?/text()")
auth=[]
for i in auths:
auth.append(i)
print(auth)

for i in range(4):
print(“作者:{},内容:{}”.format(auth[i],con[i]))

二.为结问题
获取内容时，一个人写的内容分为了好几个人，所以这边获取的内容显示不正确
三.参考资料
https://blog.csdn.net/gongbing798930123/article/details/78955597

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_16241125

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

XPath学习手册

03-23

详尽描述XPath的各种使用方法。让xml操作更简单。

xpath学习

s1162276945的博客

06-17

235

属性获取例如 &amp;amp;lt;li class=&amp;quot;item-0&amp;quot;&amp;amp;gt;&amp;amp;lt;a href=&amp;quot;https://ask.hellobi.com/link1.html&amp;quot;&amp;amp;gt;first item&amp;amp;lt;/a&a

参与评论您还未登录，请先登录后发表或查看评论

深入理解XPath：从入门到精通

最新发布

abments的博客

06-16

1424

本文将详细介绍XPath的基本概念、语法、使用示例及高级用法

【python爬虫自学笔记】-----xpath 用法

菜菜鸟的博客

08-13

576

简介 xpath是一门在xml文档中查找信息的语言。xpath可以用来在xml文档中对元素和属性进行遍历，xpath是W3C XSLT标准的主要元素，并且XQuery和XPointer都构建于xpath表达之上。安装模块lxml pip install lxml 语法表达式描述 nodename 选取此节点的所有子节点。 / 从根节点选取。 // ...

Xpath学习

天生我才必有用

01-14

404

xpath 简介 xpath 使用路径表达式在xml和html中进行导航 xpath 包含标准函数库 xpath 是一个w3c标准，使用广泛 xpath 节点关系 html> head> meta charset="utf-8" /> meta name="keywords" /> title>xpath 节点关系title> head> body>

【学习 XPath】.pdf

09-13

XPath 教程是一个系统的学习资源，它包括 XPath 简介、XPath 节点、XPath 语法、XPath 轴、XPath 运算符、XPath 函数、XPath 实例等内容。通过学习 XPath 教程，您将掌握 XPath 的基础知识和应用技能。因此，XPath...

学习xpath必看

04-25

初学者可以下载学习，对xpath的学习很有帮助。初学者可以下载学习，对xpath的学习很有帮助。

学习XPath选择器：精准定位QQ音乐歌手名字所在位置

在学习XPath选择器定位QQ音乐歌手名字所在位置之前，我们首先来探讨为什么这一定位非常重要。了解页面结构和元素位置对于实际开发和数据抓取至关重要。 #### 音乐网站页面结构分析 QQ音乐网页通常由多个模块组成，...

谷歌浏览器XPath2.0插件

06-23

XPath Helper是一款专为谷歌浏览器设计的...它不仅适合新手学习XPath，也适用于经验丰富的开发者快速调试和优化XPath表达式，大大提升了开发效率。总之，XPath Helper是每个依赖XPath进行网页处理的工作者的理想伴侣。

Datawhale-爬虫-Task4(学习xpath）

TNTZS666的博客

03-04

402

学习内容XPath简介lxml简介实例：使用xpath提取丁香园论坛的回复内容。 XPath简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。什么是XPath？ XPath 使用路径表达式在 XML 文档中进行导航 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到...

XPath 学习

abcque的专栏

04-27

507

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>index</title> </head> <body> <div> <ul> <li class="item-0"><a href="link1.html">f.

XPath学习

weixin_43171448的博客

08-14

211

XPath # 常用的方法 # 字符串格式的html文本的情况下 # 使用etree.HTML()方法把text转化成xpath对象 html = etree.HTML(text) # html文本以文件的形式存在时，使用etree.parse（）解析html文件，转化成xpath对象 html = etree.parse('./test.html', etree.HTMLParser()) # 把xpath对象转化为bytes类型 result = etree.tostring(html)

学习XPath

Super-Lee的博客

10-27

275

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。

Python xpath学习

辣手熊猫博客

03-22

265

1、xpath使用路径表达式在xml和html中进行导航2、xpath包含标准函数库3、xpath是一个w3c的标准xpath节点关系1、父节点2、子节点3、同袍节点4、先辈节点5、后代节点xpath语法article 选取所有article元素的所有子节点/article 选取根元素articlearticle/a ...

[XSL样式表]xPath学习

Jim Yang

09-14

233

test1.xml: <?xml version="1.0" encoding="utf-8"?><?xml:stylesheet type="text/xsl" href="test3.xsl"?><root> <e1> <e1-1> <e1-1-1> 1231

Python爬虫-XPath学习

m0_61796189的博客

08-25

467

虽然XPath代码比正则简单，但是遇到复杂饿节点写起来还是很肥脑子，接下来我们使用谷歌浏览器获取XPath代码，现在我们进入百度首页（https://www.baidu.com），然后右键点击检测按钮即可查看HTML代码，假设要爬取”更多“两字可参考下图操作。常见的还有选取子节点和父节点，参考XPath的基本语法规则修改即可。“//”开头的Xpath规则可以选取所有符合要求的节点，如果使用“//*”则选取整个HTML文档的所有节点，接下来选取html文件中所有的节点以及节点，并输出选取节点的名称。.....

Xpath学习之路！

xiaosongshupy的博客

03-21

220

近期为了学习scrapy，回头来在W3C上学习Xpath。我会不断在自己博客上总结知识点，并附带自己的理解。首先，小松鼠也是刚起步，有些理解不到位的地方，请各位大佬多多指教。最开始在网上跟着大佬的博客试了试scrapy框架，那是对xpath的理解是：就像正则表达式一样，是一种对数据清洗的语言。我们来看看官方的定义：XPath 使用路径表达式在 XML 文档中进行导航XPath 包含一个标准函数库X...