超简洁轻量 解析html库

这事我自己写的一个解析html xml 这类文件的库。为了使用到手机上,这个库无比要快而且要小。 不求完全自动但求简洁完全自控。有python版本 和java版本。 相信一直到其他语言也是相当容易。 在googlecode上有源码https://code.google.com/p/tagparser/ ,不用太多讲解 ,因为相当的小 只有一两百行 。直接看源码即可。

 

说过例子吧:

 

 

很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具. 正则表达式方法速度快,缺点是不好找到匹配的正则. 其他类似beautiful的工具因为要全面分析html,而html不像xml那么严格,语法比较复杂所以效率很糟糕.这个工具就是为了处里这种问题的.

这个工程只有一个文件 .tagparser.py 它可以方便分析像xml html 等这种标记语言. 只要他是'<'和'>'括起来的标记语言.

分析的方式是'抽'式的.也就是说扫描一个个字符 当遇到一个tag时 也就是遇到一个<>的时候,回调一个函数onGetTag() ,可以重载这个函数做自己的处理.

如遇到

回调 onGetTag(tagstr, tagstro). tagstr = p tagstro = P tagstr 是小写的tag tagstro是源文件的大小写状态

遇到内容 回调 onGetTxt(txtstr) ,   txtstr是如:<tag>xxxxxxxxx</tag> xxxxx即内容

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 是的,Node.js 有很多可以帮助你打包 HTML 文件。 一个常用的html-webpack-plugin,它可以将 HTML 文件和其他静态资源打包成一个单独的文件,并且可以自动插入打包后的 JavaScript 和 CSS 文件。 另外还有 gulp-htmlmin 可以帮助压缩 HTML 文件,以减小文件大小,提高加载速度。 你还可以使用 html-minifier 来压缩 HTML 文件,或者使用 html-minify-terser 来压缩和混淆 HTML 代码。 这些都可以通过 npm 包管理器安装,然后在你的 Node.js 项目中使用。 ### 回答2: 是的,Node.js有许多可以用来打包HTML。其中最常用的是Webpack和Parcel。这些可以帮助开发者将多个HTML文件和相关的资源(如CSS和JavaScript)打包成一个或多个静态文件。 Webpack是一个非常流行的模块打包工具,可以将多个HTML文件以及它们所依赖的资源打包成一个或多个bundle文件。开发者可以使用Webpack的配置文件来指定入口HTML文件和相关的资源,然后运行Webpack命令即可生成打包好的文件。 Parcel是另一个可以用来打包HTML文件的工具,它提供了一个零配置的打包解决方案。开发者只需要简单地运行Parcel命令并指定入口HTML文件,Parcel就会自动解析该文件以及它所依赖的资源,并生成最终的打包文件。 除了Webpack和Parcel,还有许多其他的打包HTML和工具可供选择,如Rollup、Gulp和Grunt等。这些和工具都提供了强大的功能和灵活的配置选项,可以根据项目的需求选择最合适的来进行HTML打包。总之,Node.js拥有丰富的打包HTML,开发者可以根据自己的需求选择最合适的工具来完成HTML打包的任务。 ### 回答3: 是的,Node.js有很多用于打包HTML。以下是一些常用的: 1. Pug(以前称为Jade):这是一个广泛使用的模板引擎,适用于Node.js和浏览器端。它允许你使用简洁的语法来编写HTML,并且可以通过编译来生成最终的HTML文件。 2. EJS:这是另一个常用的模板引擎,可以用于在Node.js中生成HTML页面。它允许你使用JavaScript的逻辑和标签来定义HTML页面的结构,使得生成动态内容变得简单。 3. Handlebars:这是一个基于模板的HTML生成,它使用简单的标记和逻辑块来定义HTML页面的结构。Handlebars支持大量的特性,包括循环、条件语句和局部模板。 4. Mustache:这是又一个轻量级的模板引擎,它使用简单的标记和变量来生成HTML页面。它非常适合用于生成静态的HTML内容。 这些都提供了便捷的API和丰富的功能,可以让你轻松地生成HTML页面。无论你是需要生成静态HTML页面还是需要在Node.js中生成动态的HTML内容,你都可以选择适合你需求的来进行打包。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值