在撒克逊人流中基本上有两种方法:
突发模式流传输:通过这种方法,将大文件的转换分解为文件小片段的转换序列。依次从输入中读取每个片段,将其变成内存中的一棵小树,进行转换,然后写入输出文件。
此方法适用于结构相当平坦的文件,例如包含数百万条日志记录的日志文件,其中每个日志记录的处理均独立于之前的记录。
此技术的一种变体使用新的XSLT 3.0 xsl:iterate指令代替xsl:for-
each遍历记录。这样可以在处理记录时维护工作数据:例如,可以在运行结束时输出总计或平均值,或者根据文件中记录的内容来处理一条记录。
。xsl:iterate指令还允许提早退出循环,这使得转换可以从大文件的开头处理数据,而无需实际读取整个文件。
XSLT和XQuery均提供突发模式流传输,但是XQuery中没有与xsl:iterate构造等效的流。
流模板:这种方法遵循传统的XSLT处理模式,该模式通过将模板规则与每个级别的节点匹配来执行输入XML层次结构的递归下降,但是一次这样做一个元素,而无需在内存中构建树。
每个模板都属于一个模式(也许是默认的未命名模式),流式传输是该模式的属性,可以使用新的xsl:mode声明来指定。如果该模式被声明为可流式处理,则该模式下的每个模板规则都必须遵守可流式处理规则。
流处理中允许的规则非常复杂,但是基本原理是给定节点的模板规则只能按顺序读取该节点的后代一次。当前Saxon实现中的限制还带来了其他规则:例如,尽管分组使用从理论上讲与流式实现是一致的,但当前在Saxon中尚未实现。