.NET(C#)：XmlReader和Whitespace以及MoveToContent和ReadToFollowing方法

最新推荐文章于 2024-10-18 11:12:21 发布

weixin_34292959

最新推荐文章于 2024-10-18 11:12:21 发布

阅读量187

点赞数

文章标签： c#

原文 http://www.cnblogs.com/mgen/archive/2012/04/26/2471403.html

XmlReader默认是读取XML文件中的Whitespace和注释的。

比如这个XML：

<root>

<file>

<file.attr>hidden</file.attr>

a.txt

</file>

</root>

XmlReader读取代码：

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

while (xr.Read())

Console.WriteLine("NodeType：{0,-20} Name：{1}", xr.NodeType, xr.Name);

}

将会输出：

NodeType：XmlDeclaration Name：xml

NodeType：Whitespace Name：

NodeType：Element Name：root

NodeType：Whitespace Name：

NodeType：Comment Name：

NodeType：Whitespace Name：

NodeType：Element Name：file

NodeType：Whitespace Name：

NodeType：Element Name：file.attr

NodeType：Text Name：

NodeType：EndElement Name：file.attr

NodeType：Text Name：

NodeType：EndElement Name：file

NodeType：Whitespace Name：

NodeType：EndElement Name：root

可以看到，Whitespace和注释都被读了进来。

解决方案之一就是在XmlReaderSettings中将IgnoreWhitespace和IgnoreComments设置为True（默认当然是False），然后再创建XmlReader：

var xrs =newXmlReaderSettings();

xrs.IgnoreComments =true;

xrs.IgnoreWhitespace =true;

using (var xr =XmlReader.Create("data.xml", xrs))

{ }

还可以使用XmlReader的MoveToContent方法，可以参考MSDN的全面解释（http://msdn.microsoft.com/zh-cn/library/system.xml.xmlreader.movetocontent.aspx）：

检查当前节点是否是内容（非空白文本、CDATA、Element、EndElement、EntityReference 或 EndEntity）节点。如果此节点不是内容节点，则读取器向前跳至下一个内容节点或文件结尾。它跳过以下类型的节点：ProcessingInstruction、DocumentType、Comment、Whitespace 或 SignificantWhitespace。

代码：

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

while (xr.Read())

{

xr.MoveToContent();

Console.WriteLine("NodeType：{0,-20} Name：{1}", xr.NodeType, xr.Name);

}

}

输出：

NodeType：Element Name：root

NodeType：Element Name：file

NodeType：Element Name：file.attr

NodeType：Text Name：

NodeType：EndElement Name：file.attr

NodeType：Text Name：

NodeType：EndElement Name：file

NodeType：EndElement Name：root

Whitespace和注释都没了。

注意不要和XmlReader的两个其他的方法混淆：MoveToAttribute和MoveToElement，这两个是在XML元素和属性之间的移动。

另外许多XmlReader的读取操作内部会调用MoveToContent方法，比如ReadElementString，ReadStartElement，ReadEndElement……

第三个要说的方法是MoveToFollowing方法，这个方法会一直读下去直到指定名称的元素被找到。这样的话我们直接去找需要的节点而直接省略那些Whitespace或者注释。

代码：

//data.xml代表上面的XML文件

using (var xr =XmlReader.Create("data.xml"))

{

//使用ReadToFollowing读至file.attr元素

xr.ReadToFollowing("file.attr");

Console.WriteLine(xr.ReadElementString());

//读取元素内的XML文本

Console.WriteLine(xr.ReadString().Trim());

}

输出：

hidden

a.txt

注意XML元素内的文字节点的Whitespace是始终保留的。

weixin_34292959

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。