golang io中io.go解读

最新推荐文章于 2024-07-15 18:37:52 发布

weixin_30779691

最新推荐文章于 2024-07-15 18:37:52 发布

阅读量369

点赞数

文章标签： golang 数据库

原文链接：http://www.cnblogs.com/dust90/p/11288435.html

版权

1. 整体大纲
2. 接口
3. 函数
4. 结构体
5. 备注

根据golang io源码包解读io.go文件。

1. 整体大纲

分别从接口，函数以及结构体去解读golang io 包中io.go文件。

2. 接口

在源代码中，对于 IO 流，定义了四个基本操作原语，分别用 Reader，Writer，Closer，Seeker 接口表达二进制流读、写、关闭、寻址等操作。根据其中的性质来区分，将分为读，写，关闭以及寻址等解读。

读

详细实现参考: bytes.Buffer

Reader

type Reader interface {
    Read(p []byte) (n int, err error)
}

Reader 接口包装了基本的 Read 方法，用于输出自身(实现者)的数据到p。Read 方法用于将对象的数据流读入到 p 中，返回读取的字节数和遇到的错误。实现者不能包含p。

在没有遇到读取错误的情况下：
- 如果读到了数据（n > 0），则应该返回 n,nil。
- 如果数据被读空，没有数据可读（n == 0），则应该返回 0,EOF¹;
遇到读取错误，则 err 应该返回相应的错误信息(如果在读取过程中发了错误即n>0,那么要考虑处理这种情况，返回错误为ErrUnexpectedEOF²);
返回0，nil,那么代表什么都没有发生。

    buf := bytes.NewBuffer([]byte("Hello World!"))
    b := make([]byte, buf.Len())

    n, err := buf.Read(b)
    fmt.Printf("%s   %v\n", b[:n], err) // output: Hello World!   <nil>

ReaderFrom

type ReaderFrom interface {
    ReadFrom(r Reader) (n int64, err error)
}

ReaderFrom 接口包装了基本的 ReadFrom 方法，用于从 r 中读取数据存入自身(即实现者本身带有p)。直到遇到 EOF 或读取出错为止，返回读取的字节数和遇到的错误。

    buf := bytes.NewBuffer([]byte("Hello World!"))
    dst := bytes.Buffer{}

    dst.ReadFrom(buf)
    dst.WriteTo(os.Stdout) // output: Hello World!

ReaderAt

type ReaderAt interface {
    ReadAt(p []byte, off int64) (n int, err error)
}

ReaderAt 接口包装了基本的 ReadAt 方法，用于将自身的数据写入 p 中。ReadAt 忽略之前的读写位置，从起始位置的 off 偏移处开始读取。

返回写入的字节数和遇到的错误:

如果 p 被写满，则 err 会返回 nil;
如果 p 没有被写满，则会返回一个错误信息用于说明为什么没有写满（比如 io.EOF）。在这方面 ReadAt 比 Read 更严格。
如果 p 被写满的同时，自身的数据也刚好被读完，则 err 即可以返回 nil 也可以返回 io.EOF。

即使不能将 p 填满，ReadAt 在被调用时也可能会使用整个 p 的空间作为缓存空间。如果 ReadAt 自身的数据是从其它地方（比如网络）获取数的，那么在写入 p 的时候，如果没有把 p 写满（比如网络延时），则 ReadAt 会阻塞，直到获取更多的数据把 p 写满，或者所有数据都获取完毕，或者遇到读取错误（比如超时）时才返回。

在这方面，ReadAt 和 Read 是不同的。

如果 ReadAt 读取的对象是某个有偏移量的底层数据流时，则 ReadAt 方法既不能影响底层的偏移量，也不应该被底层的偏移量影响。

ReadAt 的调用者可以对同一数据流并行执行 ReadAt 方法。

ReaderAt 的实现者不应该持有 p。

ByteReader

type ByteReader interface {
    ReadByte() (byte, error)
}

ByteReader 接口包装了基本的 ReadByte 方法，用于从自身读出一个字节。

返回读出的字节和遇到的错误。如果返回错误，那么没有任何输入byte被消费，所返回的byte也是无效的。

    buf := bytes.NewBuffer([]byte("Hello World!"))

    c, err := buf.ReadByte()
    fmt.Printf("%c   %s   %v\n", c, buf.String(), err) // output: H   ello World!   <nil>

ByteScanner

type ByteScanner interface {
    ByteReader
    UnreadByte() error
}

ByteScanner 在 ByteReader 的基础上增加了一个 UnreadByte 方法，用于撤消最后一次的 ReadByte 操作，以便下次的 ReadByte 操作可以读出与前一次一样的数据。

UnreadByte 之前必须是 ReadByte 才能撤消成功，否则可能会返回一个错误信息（根据不同的需求，UnreadByte 也可能返回 nil，允许随意调用 UnreadByte，但只有最后一次的 ReadByte 可以被撤销，其它 UnreadByte 不执行任何操作）。

    buf := bytes.NewBuffer([]byte("Hello World!"))

    c, err := buf.ReadByte()
    fmt.Printf("%c   %s   %v\n", c, buf.String(), err)// output: H   ello World!   <nil>

    err = buf.UnreadByte()
    fmt.Printf("%s   %v\n", buf.String(), err)//output: Hello World!   <nil>

RuneReader

type RuneReader interface {
    ReadRune() (r rune, size int, err error)
}

RuneReader 接口包装了基本的 ReadRune 方法，用于从自身读取一个 UTF-8 编码的字符到 r 中。

返回读取的字符、字符的编码长度和遇到的错误。

    buf := bytes.NewBuffer([]byte("爱Hello World!"))

    c,s, err := buf.ReadRune()
    fmt.Printf("%c  %d  %s   %v\n", c,s, buf.String(), err) // output: 爱  3  Hello World!   <nil>

RuneScanner

type RuneScanner interface {
    RuneReader
    UnreadRune() error
}

RuneScanner 在 RuneReader 的基础上增加了一个 UnreadRune 方法，用于撤消最后一次的 ReadRune 操作，以便下次的 ReadRune 操作可以读出与前一次一样的数据。UnreadRune（操作）之前必须是 ReadRune（操作）才能撤消成功，否则可能会返回一个错误信息（根据不同的需求，UnreadRune 也可能返回 nil，允许随意调用 UnreadRune，但只有最后一次的 ReadRune 可以被撤销，其它 UnreadRune 不执行任何操作）。

    buf := bytes.NewBuffer([]byte("爱Hello World!"))

    c,s, err := buf.ReadRune()
    fmt.Printf("%c  %d  %s   %v\n", c,s, buf.String(), err) // output: 爱  3  Hello World!   <nil>

    err = buf.UnreadRune()
    fmt.Printf("%c  %d  %s   %v\n", c,s, buf.String(), err)// output: 爱  3  爱Hello World!   <nil>

写

Writer

type Writer interface {
    Write(p []byte) (n int, err error)
}

Writer 接口包装了基本的 Write 方法，用于将数据存入自身。Write 方法用于将 p 中的数据写入到对象的数据流中，返回写入的字节数和遇到的错误。

如果 p 中的数据全部被写入，则 err 应该返回 nil。
如果 p 中的数据无法被全部写入，则 err 应该返回相应的错误信息。

WriterTo

type WriterTo interface {
    WriteTo(w Writer) (n int64, err error)
}

WriterTo 接口包装了基本的 WriteTo 方法，用于将自身的数据写入 w 中。

直到数据全部写入完毕或遇到错误为止，返回写入的字节数和遇到的错误。

WriterAt

type WriterAt interface {
    WriteAt(p []byte, off int64) (n int, err error)
}

WriterAt 接口包装了基本的 WriteAt 方法，用于将 p 中的数据写入自身。

ReadAt 忽略之前的读写位置，从起始位置的 off 偏移处开始写入。

返回写入的字节数和遇到的错误。如果 p 没有被读完，则必须返回一个 err 值来说明为什么没有读完。

如果 WriterAt 写入的对象是某个有偏移量的底层数据流时，则 ReadAt 方法既不能影响底层的偏移量，也不应该被底层的偏移量影响。

WriterAt 的调用者可以对同一数据流的不同区段并行执行 WriteAt 方法。WriterAt 的实现者不应该持有 p。

ByteWriter

type ByteWriter interface {
    WriteByte(c byte) error
}

ByteWriter 接口包装了基本的 WriteByte 方法，用于将一个字节写入自身。

返回遇到的错误

关闭

Closer

type Closer interface {
    Close() error
}

Closer 接口包装了基本的 Close 方法，用于关闭数据读写。

Close 一般用于关闭文件，关闭通道，关闭连接，关闭数据库等

寻址

Seeker

type Seeker interface {
    Seek(offset int64, whence int) (int64, error)
}

Seeker 接口包装了基本的 Seek 方法，用于移动数据的读写指针。

Seek 设置下一次读写操作的指针位置，每次的读写操作都是从指针位置开始的。

whence 的含义：

如果 whence 为 0：表示从数据的开头开始移动指针。
如果 whence 为 1：表示从数据的当前指针位置开始移动指针。
如果 whence 为 2：表示从数据的尾部开始移动指针。

offset 是指针移动的偏移量。返回新指针位置和遇到的错误。

    r := strings.NewReader("Hello World!")

    n, err := io.CopyN(os.Stdout, r, 5) // output: Hello
    fmt.Printf("\n%d   %v\n\n", n, err) // output: 5   <nil>

    r.Seek(0, 0)
    n, err = io.Copy(os.Stdout, r)      // output: Hello World!
    fmt.Printf("\n%d   %v\n\n", n, err) // output: 12   <nil>

3. 函数

读

ReadFull

func ReadFull(r Reader, buf []byte) (n int, err error) {
    return ReadAtLeast(r, buf, len(buf))
}

这个函数可以把对象 r 中的数据读出来，然后存入一个缓冲区 buf 中，以便其它代码可以处理 buf 中的数据。

如果没有数据读取，那么久返回拷贝的字节数和一个错误。

返回n,EOF代表没有字节可以读取了
返回ErrUnexpectedEOF，如果在读取数据的过程中发生了err
返回 n == len(buf) 或者 err == nil，代表err不存在

// 定义一个 Ustr 类型
type Ustr struct {
    s string // 数据流
    i int    // 读写位置
}

// 根据字符串创建 Ustr 对象
func NewUstr(s string) *Ustr {
    return &Ustr{s, 0}
}

// 获取未读取部分的数据长度
func (s *Ustr) Len() int {
    return len(s.s) - s.i
}

// 实现 Ustr 类型的 Read 方法
func (s *Ustr) Read(p []byte) (n int, err error) {
    for ; s.i < len(s.s) && n < len(p); s.i++ {
        c := s.s[s.i]
        // 将小写字母转换为大写字母，然后写入 p 中
        if 'a' <= c && c <= 'z' {
            p[n] = c + 'A' - 'a'
        } else {
            p[n] = c
        }
        n++
    }
    // 根据读取的字节数设置返回值
    if n == 0 {
        return n, io.EOF
    }
    return n, nil
}

func main() {
    s := NewUstr("Hello World!") // 创建 Ustr 对象 s
    buf := make([]byte, s.Len()) // 创建缓冲区 buf

    n, err := io.ReadFull(s, buf) // 将 s 中的数据读取到 buf 中

    fmt.Printf("%s\n", buf) //output:  HELLO WORLD!
    fmt.Println(n, err)     //output:  12 <nil>
}

ReadAtLeast

func ReadFull(r Reader, buf []byte) (n int, err error) {
    return ReadAtLeast(r, buf, len(buf))
}

ReadAtLeast 从 r 中读取数据到 buf 中，要求至少读取 min 个字节。
返回读取的字节数和遇到的错误。
如果 min 超出了 buf 的容量，则 err 返回 io.ErrShortBuffer，否则：

读出的数据长度 == 0 ，则 err 返回 EOF³；
读出的数据长度 < min，则 err 返回 io.ErrUnexpectedEOF⁴；
读出的数据长度 >= min，则 err 返回 nil。

    r := strings.NewReader("Hello World!") // 数据长度为12
    b := make([]byte, 15)

    n, err := io.ReadAtLeast(r, b, 12) // 要求读取至少12个字节
    fmt.Printf("%q   %d   %v\n", b[:n], n, err) // output: "Hello World!"   12   <nil>

LimitReader

func LimitReader(r Reader, n int64) Reader { return &LimitedReader{r, n} }

LimitReader 对 r 进行封装，使其最多只能读取 n 个字节的数据。相当于对 r 做了一个切片 r[:n] 返回。底层实现是一个 *LimitedReader（只有一个 Read 方法）。

    r := strings.NewReader("Hello World!")
    lr := io.LimitReader(r, 5)

    n, err := io.Copy(os.Stdout, lr)  // Hello
    fmt.Printf("\n%d   %v\n", n, err)  output: 5   <nil>

MultiReader

func MultiReader(readers ...Reader) Reader {
    r := make([]Reader, len(readers))
    copy(r, readers)
    return &multiReader{r}
}

MultiReader 将多个 Reader 封装成一个单独的 Reader，多个 Reader 会按顺序读取，当多个 Reader 都返回 EOF 之后，单独的 Reader 才返回 EOF，否则返回读取过程中遇到的任何错误。

    r1 := strings.NewReader("Hello World!")
    r2 := strings.NewReader("ABCDEFG")
    r3 := strings.NewReader("abcdefg")
    b := make([]byte, 15)
    mr := io.MultiReader(r1, r2, r3)

    for n, err := 0, error(nil); err == nil; {
        n, err = mr.Read(b)
        fmt.Printf("%q\n", b[:n])
    }
    // "Hello World!"
    // "ABCDEFG"
    // "abcdefg"
    // ""

    r1.Seek(0, 0)
    r2.Seek(0, 0)
    r3.Seek(0, 0)
    mr = io.MultiReader(r1, r2, r3)
    io.Copy(os.Stdout, mr) // output: Hello World!ABCDEFGabcdefg

TeeReader

func TeeReader(r Reader, w Writer) Reader {
    return &teeReader{r, w}
}

TeeReader 对 r 进行封装，使 r 在读取数据的同时，自动向 w 中写入数据。它是一个无缓冲的 Reader，所以对 w 的写入操作必须在 r 的 Read 操作结束之前完成。所有写入时遇到的错误都会被作为 Read 方法的 err 返回。

    r := strings.NewReader("Hello World!")
    b := make([]byte, 15)
    tr := io.TeeReader(r, os.Stdout)  // 会在屏幕输出

    n, err := tr.Read(b)                  // output: Hello World!
    fmt.Printf("\n%s   %v\n", b[:n], err) //output: Hello World!   <nil>

写

WriteString

func WriteString(w Writer, s string) (n int, err error) {
    if sw, ok := w.(StringWriter); ok {
        return sw.WriteString(s)
    }
    return w.Write([]byte(s))
}

WriteString 将字符串 s 写入到 w 中，返回写入的字节数和遇到的错误。
如果 w 实现了 WriteString 方法，则优先使用该方法将 s 写入 w 中。否则，将 s 转换为 []byte，然后调用 w.Write 方法将数据写入 w 中。

    io.WriteString(os.Stdout, "Hello World!\n") // output:  Hello World!

MultiWriter

func MultiWriter(writers ...Writer) Writer {
    allWriters := make([]Writer, 0, len(writers))
    for _, w := range writers {
        if mw, ok := w.(*multiWriter); ok {
            allWriters = append(allWriters, mw.writers...)
        } else {
            allWriters = append(allWriters, w)
        }
    }
    return &multiWriter{allWriters}
}

MultiReader 将向自身写入的数据同步写入到所有 writers 中。

    r := strings.NewReader("Hello World!\n")
    mw := io.MultiWriter(os.Stdout, os.Stdout, os.Stdout)

    r.WriteTo(mw) 
    // output: Hello World!
    // output: Hello World!
    // output: Hello World!

复制

CopyN

func CopyN(dst Writer, src Reader, n int64) (written int64, err error) {
    written, err = Copy(dst, LimitReader(src, n))
    if written == n {
        return n, nil
    }
    if written < n && err == nil {
        // src stopped early; must have been EOF.
        err = EOF
    }
    return
}

CopyN 从 src 中复制 n 个字节的数据到 dst 中，返回复制的字节数和遇到的错误。

只有当 written = n 时，err 才返回 nil。

如果 dst 实现了 ReadFrom 方法，则优先调用该方法执行复制操作。

    r := strings.NewReader("Hello World!")

    n, err := io.CopyN(os.Stdout, r, 5) // output:Hello
    fmt.Printf("\n%d   %v\n\n", n, err) // output:5   <nil>

CopyBuffer

func CopyBuffer(dst Writer, src Reader, buf []byte) (written int64, err error) {
    if buf != nil && len(buf) == 0 {
        panic("empty buffer in io.CopyBuffer")
    }
    return copyBuffer(dst, src, buf)
}

CopyBuffer 相当于 Copy，只不过Copy 在执行的过程中会创建一个临时的缓冲区来中转数据，而 CopyBuffer 则可以单独提供一个缓冲区，让多个复制操作共用同一个缓冲区，避免每次复制操作都创建新的缓冲区。如果 buf == nil，则 CopyBuffer 会自动创建缓冲区。

    r := strings.NewReader("Hello World!")
    buf := make([]byte, 32)

    n, err := io.CopyBuffer(os.Stdout, r, buf) // output: Hello World!
    fmt.Printf("\n%d   %v\n", n, err)  // output: 12   <nil>

Copy

func Copy(dst Writer, src Reader) (written int64, err error) {
    return copyBuffer(dst, src, nil)
}

Copy 从 src 中复制数据到 dst 中，直到所有数据都复制完毕，返回复制的字节数和遇到的错误。

如果复制过程成功结束，则 err 返回 nil，而不是 EOF，因为 Copy 的定义为“直到所有数据都复制完毕”，所以不会将 EOF 视为错误返回。

如果 src 实现了 WriteTo 方法，则调用 src.WriteTo(dst) 复制数据，否则如果 dst 实现了 ReadeFrom 方法，则调用 dst.ReadeFrom(src) 复制数据。

    r := strings.NewReader("Hello World!")

    n, err := io.Copy(os.Stdout, r)      // output: Hello World!
    fmt.Printf("\n%d   %v\n\n", n, err) // output:  12   <nil>

4. 结构体

SectionReader

type SectionReader struct {
    r     ReaderAt
    base  int64
    off   int64
    limit int64
}

实现了 Read, Seek, and ReadAt 接口

NewSectionReader

func NewSectionReader(r ReaderAt, off int64, n int64) *SectionReader {
    return &SectionReader{r, off, off, off + n}
}

NewSectionReader 对 r 进行封装，使其只能从 off 位置开始读取，最多只能读取 n个字节的的数据。相当于对 r 做了一个切片 r[off:off+n] 返回。底层实现是一个 *SectionReader。

Size

func (s *SectionReader) Size() int64 { return s.limit - s.base }

Size 返回允许读取部分的大小（即切片的长度 n）

使用示例

    r := strings.NewReader("Hello World!")
    sr := io.NewSectionReader(r, 6, 5)

    n, err := io.Copy(os.Stdout, sr)                  // output: World
    fmt.Printf("\n%d   %d   %v\n", sr.Size(), n, err) // output: 5   5   <nil>

LimitedReader

type LimitedReader struct {
    R Reader // underlying reader
    N int64  // max bytes remaining
}

实现Read接口

使用示例

    r := strings.NewReader("Hello World!")
    sr := io.LimitedReader{r,2}

    buf := make ([]byte,12)

    n, err := sr.Read(buf)
    fmt.Printf("\n%d  %s   %v\n", n,buf[:n], err) // output: 2  He   <nil>

teeReader

type teeReader struct {
    r Reader
    w Writer
}

结合TeeReader函数使用

5. 备注

EOF is the error returned by Read when no more input is available.Functions should return EOF only to signal a graceful end of input.If the EOF occurs unexpectedly in a structured data stream,the appropriate error is either ErrUnexpectedEOF or some other error↩
ErrUnexpectedEOF means that EOF was encountered in the middle of reading a fixed-size block or data structure.↩
EOF is the error returned by Read when no more input is available.Functions should return EOF only to signal a graceful end of input.If the EOF occurs unexpectedly in a structured data stream,the appropriate error is either ErrUnexpectedEOF or some other error↩
ErrUnexpectedEOF means that EOF was encountered in the middle of reading a fixed-size block or data structure.↩