实现HTML的简单压缩

最新推荐文章于 2024-04-14 23:17:04 发布

snaill

最新推荐文章于 2024-04-14 23:17:04 发布

阅读量4.4k

点赞数

分类专栏： C# XML应用文章标签： html xml linq xhtml javascript google

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/snaill/article/details/5046209

版权

C# 同时被 2 个专栏收录

39 篇文章 0 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

PageReleaser需要一种HTML的压缩算法，Google了很久，发现如果只是简单去除空白和注释的话，使用XLinq就可以轻易的实现

先看看MSDN是怎么说的：

一种常用方案是读取缩进的 XML，在内存中创建一个没有任何空白文本节点（即不保留空白）的 XML 树，对该 XML 执行某些操作，然后保存带缩进的 XML。在序列化带格式的 XML 时，只保留 XML 树中有意义的空白。这是 LINQ to XML 的默认行为。

另一个常见的情况是读取和修改已经有意缩进的 XML。您可能不想以任何方式更改这种缩进。若要在 LINQ to XML 中执行此操作，您要在加载或解析 XML 时保留空白，并在序列化 XML 时禁用格式设置。

简单的说，XDocument载入时，默认使用LoadOptions::None，自动去掉XML的空白；保存时，默认使用SaveOptions::None，自动格式化XML。

也就是说，使用XDocument将一个HTML文档打开什么也不作就保存，其实等于实现了HTML的格式化。

而如果在保存时，使用SaveOptions::DisableFormatting参数，看似要保存XML的空白，由于载入时所有空白都被删掉了，其实等于删除了所有空白，于是去掉空白就这样实现了。

至于删掉注释也很简单，只是需要注意，一般页面嵌入JavaScript会使用注释节点包裹，需要例外处理。

整个HTML压缩代码如下：

var nodes = from s in doc.DescendantNodes()
           where s.NodeType == XmlNodeType.Comment &&
           string.Compare( s.Parent.Name.LocalName, "script", true ) != 0
           select s;

nodes.Remove();
doc.Save( sm.OutputPath + "index.html", SaveOptions.DisableFormatting );

简单吧，不过HTML不能直接使用XML解析器，需要预先转换为XHTML，点击察看转换实现。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
实现HTML的简单压缩

PageReleaser需要一种HTML的压缩算法，Google了很久，发现如果只是简单去除空白和注释的话，使用XLinq就可以轻易的实现先看看MSDN是怎么说的：一种常用方案是读取缩进的 XML，在内存中创建一个没有任何空白文本节点（即不保留空白）的 XML 树，对该 XML 执行某些操作，然后保存带缩进的 XML。在序列化带格式的 XML 时，只保留 XML 树中有意义的空白。这
复制链接

扫一扫

专栏目录

snaill CSDN认证博客专家 CSDN认证企业博客

码龄24年

159: 原创

51万+: 周排名

97万+: 总排名

96万+: 访问

: 等级

1万+: 积分

598: 粉丝

17: 获赞

220: 评论

70: 收藏

私信

关注

热门文章

分类专栏

ASP.net 50篇
Boost 5篇
C# 39篇
COM 47篇
CppUnit 13篇
Cygwin/MinGW 26篇
DocBook 5篇
GNU/Linux/C++ 6篇
Log4Cpp 1篇
Mozilla
MySQL
Python
SDL 16篇
SymbianOS 19篇
WAP/WML 7篇
WTL 7篇
wxWidgets 10篇
XML-RPC/SOAP 4篇
XML应用 12篇
XMPP 9篇
加密解密 6篇
常识 6篇
我爱开源 8篇
文字 22篇
未分类文档 34篇
记事随笔 25篇
项目管理 12篇
食谱 20篇

最新评论

[歌词]Save Me - Remy Zero
JourneyFlower: 我记得第一次看这个电视剧还是在小学四年级，好像是2008年，在河北卫视播的，大人对这部剧没什么兴趣，但是我喜欢看，没办法还是一点一点间断看了几集，现在长大了来补剧的，这个片头音乐真的好有回忆感，剧情也如同二楼说的那样从第五季开始确实不如之前几季吸引人了，我也还是慢慢的继续追完，现在看到第五季第八集了
使用 XSLT 转换 DocBook 文档
Tisfy: 文笔流畅，修辞得体，深得魏晋诸朝遗风
清煮鲫鱼
WgRui: 有用
ASP.Net本地化/国际化解决方案原理和代码示例
天使之一: asp:FileUpload 怎么国际化
ATL布幔之下的秘密(1)
vctrane_007: 看完获益匪浅，很赞，有一个小问题#define定义的函数宏后面的反斜杠是'\',可能笔误导致。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。