解析html页面的选择

最新推荐文章于 2021-06-09 11:22:02 发布

zhengdanwei

最新推荐文章于 2021-06-09 11:22:02 发布

阅读量1.1k

点赞数

分类专栏：学习笔记文章标签： html filter xhtml xml jquery 工具

本文链接：https://blog.csdn.net/zhengdanwei/article/details/6903002

版权

学习笔记专栏收录该内容

30 篇文章 0 订阅

订阅专栏

虽然html与xml类似，但宽松的标准决定了它不能以xml解析器来解析，下面列出解析html的三种解决方案：

1.htmlparser

最常见的方法，htmlparser这个工具已经十分成熟了，解析各类html页面都可以胜任，但是选择标签的方法只有各类filter，没法按照网页结构来选择

优点：通用面广，鲁棒性强

缺点：结构查询能力太弱

2.tidy+xpath

tidy是将html页面转换为严格的xhtml页面的工具，转换以后的页面可以适应xml标准因此就可以使用xpath来解析了

优点：可以使用xpath强大的查询能力

缺点：目前tidy的通用性还不够，有些不标准的页面还是没法转换

3 jsoup

据说功能比htmlparser强大，有时间去试一下

================================

感觉确实比htmlparser强大，容易上手、查询方便、鲁棒性强，在没深入了解之前是找不到什么缺点了

最重要的就是容易上手这一点了，稍微看看文档就会用，查询方式用的是DOM和jquery的查询方式，不像htmlparser那些filter一样需要额外的学习，光是这点我想作为用jsoup的理由就足够了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zhengdanwei

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JavaScript系列代码40:选择页面

BLOG域名:programb.blog.csdn.net

04-17

1427

Relational Operators This section describes the JavaScript relational operators. These operators test for a relationship (such as “less than” or “property of”) between two values and return TRue or fa...

html页面使用选择器

sxl2017的博客

08-03

577

1.遇到几个li，设置其中一个li的左边距该如何设置？第一种情况：页面的li不是动态生成的，直接在该li上设置margin-left即可第二种情况：li是动态生成的：结构如下 <div class="pro7"> <ul> <a href="#"><li >镍铬钼球墨无限冷硬（离心）</li></a> <a href="#"><li >高镍铬钼无限...

参与评论您还未登录，请先登录后发表或查看评论

弹出选择页面。

Neo in SAP

06-01

1648

弹出选择页面。功能介绍：点击页面上的某个控件，将数据传入到另一个页面并以弹出窗体的形式弹出。在那个页面做相应处理后回到原始页面，并将处理过的数据传会来。类似Windows的选择窗体。在基础页面用如下代码：@ Page Language="C#" AutoEventWireup="true" CodeFile="SelectForm.aspx.cs" Inherits="

JavaScript系列代码43:选择页面

BLOG域名:programb.blog.csdn.net

04-17

860

Bitwise Operators Despite the fact that all numbers in JavaScript are floating-point numbers, the bitwise operators require numeric operands that have integer values. They operate on these integer ope...

HTML——JS—选择页码（案例）

piduocheng0577的博客

03-18

1757

页码的选择 <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title></title> <style> #box{ /* background-color: palegoldenrod; */ } .pr...

Android开发之利用jsoup解析HTML页面的方法

09-02

这时，我们可以利用jsoup这个强大的Java库来解析HTML页面。jsoup提供了丰富的API，使得处理HTML文档变得简单易行。本文将详细介绍如何在Android项目中集成并使用jsoup来解析HTML页面。首先，我们需要在Android项目...

易语言HTML网页解析类1.0源码-易语言

06-12

通过正则表达式Deelx来分析网页源码，然后进行解析。这个第一个版本，效率应该也不是很高，当然可能也存在一定BUG。 JSON、XML解析器网上都有，唯独缺少HTML的，我就先开发一个低效率版吧，等大神来开发效率版的HTML...

短视频去水印解析HTML源码

最新发布

03-29

大多数短视频平台采用动态加载技术，视频内容并不是直接在HTML页面中嵌入，而是通过JavaScript或者API请求获取。去水印解析HTML源码需要分析这些动态加载的机制，找到视频数据的真实来源。这可能涉及到对网络请求的...

HTML网页内容解析器源码

07-31

6. **CSS选择器支持**：为了更方便地定位和操作特定的HTML元素，解析器可能包含对CSS选择器的支持。 7. **错误处理**：HTML文档可能存在语法错误或不规范的情况，解析器需要有良好的容错机制，尽可能地解析出有效...

HTML页面加载和解析流程详细介绍

12-13

2. 在渲染到页面的某一部分时，其上面的所有部分都已经下载完成（并不是说所有相关联的元素都已经下载完）。 3. 如果遇到语义解释性的标签嵌入文件（JS脚本，CSS样式），那么此时IE的下载过程会启用单独连接进行...

html页面选择时间

qq_40247975的博客

01-06

4068

html页面中选择时间注意：需要导入包。 <script src="${request.contextPath}/js/bootstrap-datetimepicker.js"></script> <div> <input id="chTime" name="time"> </div> $(function

关于选择页面的设计模式

KimYoo的专栏

11-21

4492

新建网页 1 b/s难免会用到选择页面：比如选客户，选员工，选产品等等，对于这些，我们通常的方法是打开一个新窗口，上面会有上述内容的列表，然后我们勾选一下返回就可以了，通过一段时间的使用，渐渐发现了某些弊端：弹出窗口对于有些机器来说会很慢频繁选择使客户失去耐心我对我要选的内容很熟悉，为什么还要给我一大堆的列表而且这些列表显示

html弹出选择,做一个多项选择界面，选择一项弹出一个新页面，选择完这一项之后，返回之前的html页面_html/css_WEB-ITnose...

weixin_35867127的博客

06-03

710

html做一个多项选择界面，选择一项弹出一个新页面，选择完这一项之后，返回之前的主html页面。比如说主页面A，有两个选择项，1和2，点击弹出对应的页面1和页面2，在这两个页面选择对应的东西，选择完页面1之后把数据返回到A主页面两个text里，继续选择页面2，选择完页面2后，数据返回到A主页面另一个text里回复讨论(解决方案)我现在已经做出了选择功能了，但是选择完一个再选另一个，之前已经选择好了...

html 滑块选择数量,HTML5 简单的范围输入控件/滑块

weixin_35397676的博客

06-03

412

CSS语言：CSSSCSS确定html {background: #f3f3f3;}input[type='range'] {-webkit-appearance: none;position: absolute;top: 50%;left: 50%;border: none;padding: 0 2em;width: 22.25em;height: 4em;border-radius: 0.25...

html打印自动生成页数,打印html时打印页面上的页码

weixin_35558751的博客

05-30

4003

由于@page与pagenumbers在浏览器不工作现在我正在寻找替代品。我发现Oliver Kohll发布了一个answer。我会在这里转贴，所以每个人都可以更容易地找到它：对于这个答案，我们不使用@page，这是一个纯CSS的答案，但在FireFox 20版本中工作。这是link的一个例子。CSS是：#content {display: table;}#pageFooter {display:...

选中页面所有checkbox

逆水行舟不进则退，学无先后达者为先。

10-11

168

javascript:var inputs = document.getElementsByTagName('input');Array.forEach(inputs,function(item){if(item.type=='checkbox')item.checked='checked';}); 需要JavaScript1.6的支持

基本页面html选择按钮,选择不同的单选按钮进入不同的html页面

weixin_33987275的博客

06-09

1778

我有2套单选按钮，这是我要做到以下几点：。选择不同的单选按钮进入不同的html页面1)当所有的选择都是假的，显示的验证消息(这是工作，但点击时'重复保存'它会添加一个空行，我该如何防止这一点？)。2)如果只选择设置1或设置2，则显示保存时的错误消息。 3)。当选择Set 1时，Set 2选择需要根据是或否将用户带到不同的页面。在此先感谢！ Please make a selectionRadio ...

html选择数量,控制标签的显示数量—css3: nth-child()

weixin_42524530的博客

06-03

656

需求：①前端页面最多显示三个tag，多余的在代码中全部显示。②且在调用接口的时候也要起作用，后端到时会将全部数据渲染出。html部分:123456css部分:/* 表示选择列表中的标签从0到3，即小于3的标签 */.key_box a:nth-child(-n+3) {color: green;}/* 表示选择列表中的标签从第3个开始一直到最后 */.key_box a:nth-child(n+4...

使用jsoup高效解析和操作HTML

jsoup不仅能解析HTML文档，还支持从URL直接获取内容，非常适合进行网页抓取任务。其强大的解析引擎能自动修复不完整的HTML结构，保证了解析结果的整洁和准确。" 在深入探讨jsoup之前，让我们先理解一下HTML解析的...