Go语言圣经 - 第7章 接口 - 7.14 示例:基于标记的XML解码

第7章 接口

接口类型是对其它类型行为的抽象和概括.接口类型不会和特定的实现细节绑定在一起,这种抽象的方式能让我们的函数更加的灵活和更具有适应能力

Go语言的接口比较特殊,因为它是满足隐式实现的。也就是说,我们无需给具体类型定义所有满足足的接口类型,只需要让类型拥有一些简单必要的方法。这样我们新建一个接口类型,满足具体类型,并且我们不需要更改这些类型的定义。当我们使用的类型来自于不受我们控制的包时,这种机制比较有用

7.14 示例:基于标记的XML解码

在4.5章节中,我们使用了encoding/json包中的Marshal和Unmarshal函数来将JSON文档转换成Go语言的数据结构

enconding/xml包提供了一个相似的API,当我们构建一个文档树时可以使用这个便捷的包,它提供了一个更底层的基于标记的API用于XML解码,在基于标记的样式中,解析器消费输入并产生一个标记流,四个主要的标记类型,StartElement,EndElement,CharData和Comment,每一个都是encoding/xml包中具体类型,每一个对(*xml.Decoder).Token的调用都返回一个标记

这里显示的是和这个API相关的部分

package xml

import "io"

type Name struct {
	local string
}

type Attr struct {
	Name Name
	Value string
} 

type Token interface {}

type StartElement struct {Name Name}
type CharData []byte
type Comment []byte

type Decoder struct {/*...*/}
func NewDecoder(io.Reader) *Decoder
func (*Decoder) Token() (Token,error)

上述没有方法的Token接口也是一个可识别联合的例子,可识别联合类型几乎没有方法,操作它们的函数使用一个类型分支的case集合来进行表述,case集合中每个case都有不同的逻辑

下面的xmlselect 程序获取和打印在一个XML文档树中确定的元素下找到的文本。使用上面的API,它可以在输入上一次完成它的工作从来不要实例化这个文档树

package main

import (
	"encoding/xml"
	"fmt"
	"io"
	"os"
	"strings"
)

func main() {
	dec := xml.NewDecoder(os.Stdin)
	var stack []string
	for {
		tok, err := dec.Token()
		if err == io.EOF {
			break
		} else if err != nil {
			fmt.Fprintf(os.Stderr, "xmlselect:%v\n", err)
			os.Exit(1)
		}
		switch tok := tok.(type) {
		case xml.StartElement:
			stack = append(stack, tok.Name.Local)
		case xml.EndElement:
			stack = stack[:len(stack)-1]
		case xml.CharData:
			if containsAll(stack, os.Args[1:]) {
				fmt.Printf("%s:%s\n", strings.Join(stack, " "), tok)
			}
		}
	}
}
func containsAll(x, y []string) bool {
	for len(y) <= len(x) {
		if len(y) == 0 {
			return true
		}
		if x[0] == y[0] {
			y = y[1:]
		}
		x = x[1:]
	}
	return false
}1

main函数中的循环每遇到一个StartElement时,它把这个元素的名称压到一个栈里,并且每次遇到搭配EndElement时,将这个名称从栈里推出。这API保证了StartElement和EndElement的序列可以被完全匹配,当xmlselect遇到一个CharData时,只有当栈中有序的包含所有通过命令行传入的元素名称时,才会输出相应的文本

下面的命令打印出任意出现在两层div元素下的h2元素文本,它输入的是XML说明文档,并且它自己就是XML文档格式的

$ go build gopl.io/ch1/fetch
$ ./fetch http://www.w3.org/TR/2006/REC-xml11-20060816 |
    ./xmlselect div div h2
html body div div h2: 1 Introduction
html body div div h2: 2 Documents
html body div div h2: 3 Logical Structures
html body div div h2: 4 Physical Structures
html body div div h2: 5 Conformance
html body div div h2: 6 Notation
html body div div h2: A References
html body div div h2: B Definitions for Character Normalization

补充几点:

何时使用接口?只有在两个或者两个以上类型必须以相同的方式处理时才需要,例外情况是,具体类型和接口不在一个包中,让具体类型实现这个接口是解耦这两个包的比较好的方式

当然上述思维只是一种较普遍的“默认规范”具体的任何知识点还是要回归于问题本身

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值