golang: 详解interface和nil

golang的nil在概念上和其它语言的null、None、nil、NULL一样,都指代零值或空值。nil是预先说明的标识符,也即通常意义上的关键字。在golang中,nil只能赋值给指针、channel、func、interface、map或slice类型的变量。如果未遵循这个规则,则会引发panic。对此官方有明确的说明:http://pkg.golang.org/pkg/builtin/#Type

golang中的interface类似于java的interface、PHP的interface或C++的纯虚基类。接口就是一个协议,规定了一组成员。这个没什么好说的,本文不打算对宏观上的接口概念和基于接口的范式编程做剖析。golang语言的接口有其独到之处:只要类型T的公开方法完全满足接口I的要求,就可以把类型T的对象用在需要接口I的地方。这种做法的学名叫做Structural Typing,有人也把它看作是一种静态的Duck Typing。所谓类型T的公开方法完全满足接口I的要求,也即是类型T实现了接口I所规定的一组成员。

在底层,interface作为两个成员来实现,一个类型和一个值。对此官方也有文档说明:http://golang.org/doc/go_faq.html#nil_error,如果您不习惯看英文,这里有一篇柴大的翻译:Go中error类型的nil值和nil 。

接下来通过编写测试代码和gdb来看看interface倒底是什么。会用到反射,如果您不太了解golang的反射是什么,这里有刑星翻译自官方博客的一篇文章:反射的规则,原文在:laws-of-reflection

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2.    
  3. import (  
  4.     "fmt"  
  5.     "reflect"  
  6. )  
  7.    
  8. func main() {  
  9.     var val interface{} = int64(58)  
  10.     fmt.Println(reflect.TypeOf(val))  
  11.     val = 50  
  12.     fmt.Println(reflect.TypeOf(val))  
  13. }  
我们已经知道接口类型的变量底层是作为两个成员来实现,一个是type,一个是data。type用于存储变量的动态类型,data用于存储变量的具体数据。在上面的例子中,第一条打印语句输出的是:int64。这是因为已经显示的将类型为int64的数据58赋值给了interface类型的变量val,所以val的底层结构应该是:(int64, 58)。我们暂且用这种二元组的方式来描述,二元组的第一个成员为type,第二个成员为data。第二条打印语句输出的是:int。这是因为字面量的整数在golang中默认的类型是int,所以这个时候val的底层结构就变成了:(int, 50)。借助于gdb很容易观察到这点:
[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. $ cd $GOPATH/src/interface_test  
  2. $ go build -gcflags "-N -l"  
  3. $ gdb interface_test  

接下来说说interface类型的值和nil的比较问题。这是个比较经典的问题,也算是golang的一个坑。


接下来看看代码

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2. import (  
  3.     "fmt"  
  4. )  
  5. func main() {  
  6.     var val interface{} = nil  
  7.     if val == nil {  
  8.         fmt.Println("val is nil")  
  9.     } else {  
  10.         fmt.Println("val is not nil")  
  11.     }  
  12. }  
变量val是interface类型,它的底层结构必然是(type, data)。由于nil是untyped(无类型),而又将nil赋值给了变量val,所以val实际上存储的是(nil, nil)。因此很容易就知道val和nil的相等比较是为true的。

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. $ cd $GOPATH/src/interface_test  
  2. $ go build  
  3. $ ./interface_test  
  4. val is nil  

对于将任何其它有意义的值类型赋值给val,都导致val持有一个有效的类型和数据。也就是说变量val的底层结构肯定不为(nil, nil),因此它和nil的相等比较总是为false。

上面的讨论都是在围绕值类型来进行的。在继续讨论之前,让我们来看一种特例:(*interface{})(nil)。将nil转成interface类型的指针,其实得到的结果仅仅是空接口类型指针并且它指向无效的地址。注意是空接口类型指针而不是空指针,这两者的区别蛮大的,学过C的童鞋都知道空指针是什么概念。

关于(*interface{})(nil)还有一些要注意的地方。这里仅仅是拿(*interface{})(nil)来举例,对于(*int)(nil)、(*byte)(nil)等等来说是一样的。上面的代码定义了接口指针类型变量val,它指向无效的地址(0x0),因此val持有无效的数据。但它是有类型的(*interface{})。所以val的底层结构应该是:(*interface{}, nil)。有时候您会看到(*interface{})(nil)的应用,比如var ptrIface = (*interface{})(nil),如果您接下来将ptrIface指向其它类型的指针,将通不过编译。或者您这样赋值:*ptrIface = 123,那样的话编译是通过了,但在运行时还是会panic的,这是因为ptrIface指向的是无效的内存地址。其实声明类似ptrIface这样的变量,是因为使用者只是关心指针的类型,而忽略它存储的值是什么。还是以例子来说明:

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2. import (  
  3.     "fmt"  
  4. )  
  5. func main() {  
  6.     var val interface{} = (*interface{})(nil)  
  7.     // val = (*int)(nil)  
  8.     if val == nil {  
  9.         fmt.Println("val is nil")  
  10.     } else {  
  11.         fmt.Println("val is not nil")  
很显然,无论该指针的值是什么:(*interface{}, nil),这样的接口值总是非nil的,即使在该指针的内部为nil。

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. $ cd $GOPATH/src/interface_test  
  2. $ go build  
  3. $ ./interface_test  
  4. val is not nil  
interface类型的变量和nil的相等比较出现最多的地方应该是error接口类型的值与nil的比较。有时候您想自定义一个返回错误的函数来做这个事,可能会写出以下代码:

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2.    
  3. import (  
  4.     "fmt"  
  5. )  
  6.    
  7. type data struct{}  
  8.    
  9. func (this *data) Error() string { return "" }  
  10.    
  11. func test() error {  
  12.     var p *data = nil  
  13.     return p  
  14. }  
  15.    
  16. func main() {  
  17.     var e error = test()  
  18.     if e == nil {  
  19.         fmt.Println("e is nil")  
  20.     } else {  
  21.         fmt.Println("e is not nil")  
  22.     }  
  23. }  
但是很可惜,以上代码是有问题的。

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. $ cd $GOPATH/src/interface_test  
  2. $ go build  
  3. $ ./interface_test  
  4. e is not nil  

我们可以来分析一下。error是一个接口类型,test方法中返回的指针p虽然数据是nil,但是由于它被返回成包装的error类型,也即它是有类型的。所以它的底层结构应该是(*data, nil),很明显它是非nil的。可以打印观察下底层结构数据:

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2.    
  3. import (  
  4.     "fmt"  
  5.     "unsafe"  
  6. )  
  7.    
  8. type data struct{}  
  9.    
  10. func (this *data) Error() string { return "" }  
  11.    
  12. func test() error {  
  13.     var p *data = nil  
  14.     return p  
  15. }  
  16.    
  17. func main() {  
  18.     var e error = test()  
  19.    
  20.     d := (*struct {  
  21.         itab uintptr  
  22.         data uintptr  
  23.     })(unsafe.Pointer(&e))  
  24.    
  25.     fmt.Println(d)  
  26. }  
  27.   
  28. $ cd $GOPATH/src/interface_test  
  29. $ go build  
  30. $ ./interface_test  
  31. &{3078907912 0}  
正确的做法应该是:

[cpp] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. package main  
  2.    
  3. import (  
  4.     "fmt"  
  5. )  
  6.    
  7. type data struct{}  
  8.    
  9. func (this *data) Error() string { return "" }  
  10.    
  11. func bad() bool {  
  12.     return true  
  13. }  
  14.    
  15. func test() error {  
  16.     var p *data = nil  
  17.     if bad() {  
  18.         return p  
  19.     }  
  20.     return nil  
  21. }  
  22.    
  23. func main() {  
  24.     var e error = test()  
  25.     if e == nil {  
  26.         fmt.Println("e is nil")  
  27.     } else {  
  28.         fmt.Println("e is not nil")  
  29.     }  
  30. }  




没有更多推荐了,返回首页