第7章 接口
接口类型是对其它类型行为的抽象和概括.接口类型不会和特定的实现细节绑定在一起,这种抽象的方式能让我们的函数更加的灵活和更具有适应能力
Go语言的接口比较特殊,因为它是满足隐式实现的。也就是说,我们无需给具体类型定义所有满足足的接口类型,只需要让类型拥有一些简单必要的方法。这样我们新建一个接口类型,满足具体类型,并且我们不需要更改这些类型的定义。当我们使用的类型来自于不受我们控制的包时,这种机制比较有用
7.14 示例:基于标记的XML解码
在4.5章节中,我们使用了encoding/json包中的Marshal和Unmarshal函数来将JSON文档转换成Go语言的数据结构
enconding/xml包提供了一个相似的API,当我们构建一个文档树时可以使用这个便捷的包,它提供了一个更底层的基于标记的API用于XML解码,在基于标记的样式中,解析器消费输入并产生一个标记流,四个主要的标记类型,StartElement,EndElement,CharData和Comment,每一个都是encoding/xml包中具体类型,每一个对(*xml.Decoder).Token的调用都返回一个标记
这里显示的是和这个API相关的部分
package xml
import "io"
type Name struct {
local string
}
type Attr struct {
Name Name
Value string
}
type Token interface {}
type StartElement struct {Name Name}
type CharData []byte
type Comment []byte
type Decoder struct {/*...*/}
func NewDecoder(io.Reader) *Decoder
func (*Decoder) Token() (Token,error)
上述没有方法的Token接口也是一个可识别联合的例子,可识别联合类型几乎没有方法,操作它们的函数使用一个类型分支的case集合来进行表述,case集合中每个case都有不同的逻辑
下面的xmlselect 程序获取和打印在一个XML文档树中确定的元素下找到的文本。使用上面的API,它可以在输入上一次完成它的工作从来不要实例化这个文档树
package main
import (
"encoding/xml"
"fmt"
"io"
"os"
"strings"
)
func main() {
dec := xml.NewDecoder(os.Stdin)
var stack []string
for {
tok, err := dec.Token()
if err == io.EOF {
break
} else if err != nil {
fmt.Fprintf(os.Stderr, "xmlselect:%v\n", err)
os.Exit(1)
}
switch tok := tok.(type) {
case xml.StartElement:
stack = append(stack, tok.Name.Local)
case xml.EndElement:
stack = stack[:len(stack)-1]
case xml.CharData:
if containsAll(stack, os.Args[1:]) {
fmt.Printf("%s:%s\n", strings.Join(stack, " "), tok)
}
}
}
}
func containsAll(x, y []string) bool {
for len(y) <= len(x) {
if len(y) == 0 {
return true
}
if x[0] == y[0] {
y = y[1:]
}
x = x[1:]
}
return false
}1
main函数中的循环每遇到一个StartElement时,它把这个元素的名称压到一个栈里,并且每次遇到搭配EndElement时,将这个名称从栈里推出。这API保证了StartElement和EndElement的序列可以被完全匹配,当xmlselect遇到一个CharData时,只有当栈中有序的包含所有通过命令行传入的元素名称时,才会输出相应的文本
下面的命令打印出任意出现在两层div元素下的h2元素文本,它输入的是XML说明文档,并且它自己就是XML文档格式的
$ go build gopl.io/ch1/fetch
$ ./fetch http://www.w3.org/TR/2006/REC-xml11-20060816 |
./xmlselect div div h2
html body div div h2: 1 Introduction
html body div div h2: 2 Documents
html body div div h2: 3 Logical Structures
html body div div h2: 4 Physical Structures
html body div div h2: 5 Conformance
html body div div h2: 6 Notation
html body div div h2: A References
html body div div h2: B Definitions for Character Normalization
补充几点:
何时使用接口?只有在两个或者两个以上类型必须以相同的方式处理时才需要,例外情况是,具体类型和接口不在一个包中,让具体类型实现这个接口是解耦这两个包的比较好的方式
当然上述思维只是一种较普遍的“默认规范”具体的任何知识点还是要回归于问题本身