golang硬核技术(二)go程序从启动到运行到底经历了啥

前言

go相对其他语言,对并发的支持更友好。这使得他的设计和其他程序迥然不同。让我们来看看它都是如何初始化程序的,从程序加载到运行到底经历的什么。

我们继续之前的版本1.18.4

汇编入口

首先我们编译一个hello world 程序。

package main
import "fmt"
func main(){
    fmt.Println("hello world")
}

编译时带上调试信息

go build -gcflags=all="-N -l" -ldflags=-compressdwarf=false

用gdb启动,找到入口

image.png

可以看到入口点在rt0_darwin_amd64.s,这里解释一下文件名:

  • rt0 : runtime0 表示起始运行时
  • darwin : 操作系统 我这里是mac系统 对应(GOOS)
  • amd64 : 操作系统架构 对应(GOHOSTARCH)

启动文件位于GOROOT/src/runtime目录下,那同理可以看到其他系统的启动文件

image.png

看一下这个启动文件干了嘛

#include "textflag.h" //定义了一些特殊的宏,用于标记全局符号(函数和全局变量)

//在Go汇编语言中,内存是通过SB伪寄存器定位。SB是Static base pointer 的缩写,意为静态内存的开始地址。
//所有的静态全局符号可以通过SB加一个偏移量定位,而我们定义的符号其实就是相对于SB内存开始地址偏移量。
//对于SB伪寄存器,全局变量和全局函数的符号并没有任何区别。

TEXT _rt0_amd64_darwin(SB),NOSPLIT,$-8 
   JMP    _rt0_amd64(SB) //跳转执行程序的入口函数

TEXT _rt0_amd64_darwin_lib(SB),NOSPLIT,$0
   JMP    _rt0_amd64_lib(SB) //跳转lib库的入口函数

再看下_rt0_amd64函数,位于runtime目录下的asm_amd64.s文件中

TEXT _rt0_amd64(SB),NOSPLIT,$-8
   MOVQ   0(SP), DI  // argc
   LEAQ   8(SP), SI  // argv
   JMP    runtime·rt0_go(SB) 

最终跳转到runtime·rt0_go(SB) 这里是整个go代码的起点,看一下这个函数的重点部分

rt0_go函数

TEXT runtime·rt0_go(SB),NOSPLIT|TOPFRAME,$0
    ...
    // 略过前置设置和检查
    
    // 这段有大量的 m0,g0 tls的分配,设置内容,懒得写略过了
    get_tls(BX) 
    // 将g0保存到tls中
    LEAQ   runtime·g0(SB), CX 
    ...
    
    //运行时类型检查,主要是校验编译器的翻译工作是否正确。
    //基本代码均为检查 int8 在 unsafe.Sizeof 方法下是否等于 1 这类动作。
   CALL   runtime·check(SB)
   ...
   //系统参数传递,主要是将系统参数转换传递给程序使用。
   CALL   runtime·args(SB)
   //系统基本参数设置,主要是获取 CPU 核心数和内存物理页大小
   CALL   runtime·osinit(SB)
   //进行各种运行时组件的初始化,包含调度器、内存分配器、堆、栈、GC 等一大堆初始化工作。
   //会进行 p 的初始化,并将 m0 和某一个 p 进行绑定。
   CALL   runtime·schedinit(SB)

   //创建一个新的 goroutine 来启动程序
   //虽然在runtime·rt0_go 中指向的是$runtime·mainPC,但实质指向的是 runtime.main
   MOVQ   $runtime·mainPC(SB), AX       // entry
   
   //创建一个新的 goroutine,且绑定 runtime.main 方法(也就是应用程序中的入口 main 方法)。
   //并将其放入 m0 绑定的p的本地队列中去,以便后续调度。
   CALL   runtime·newproc(SB)

   //启动 M.mstart,调度器开始进行循环调度。
   CALL   runtime·mstart(SB)

   CALL   runtime·abort(SB)  // M.mstart 应该永不返回
   RET
    ...

从这个汇编文件中,开始调用runtime方法。

go在1.5的版本里就实现了自举,所有大部分的功能都是用go实现的,并多处于runtime文件夹中。

runtime

check

check函数位于runtime的runtime1.go中,主要是检查一些标识,有兴趣的可以自己去看一下。

args

args 函数同样runtime的runtime1.go中。

var (
   argc int32   //参数个数
   argv **byte  //入参
)

func args(c int32, v **byte) { //初始全局变量 argc,argv 并调用sysargs
   argc = c
   argv = v
   sysargs(c, v)
}

var executablePath string  

//获取执行程序路径 复制到全局变量executablePath
func sysargs(argc int32, argv **byte) {
    。。。
}

osinit

osinit位于runtime的os_darwin.go中,我这里是mac系统所以是darwin

func osinit() {
   ncpu = getncpu()             //获取cpu核数
   physPageSize = getPageSize() //获取页大小
}

在mac下,这里实际就是调用sysctl获取系统信息。你也可以理解函数对应命令行是这样的:

  • getncpu() -> sysctl -h -a | grep hw.ncpu
  • getPageSize() -> sysctl -h -a | grep hw.pagesize

schedinit

schedinit位于runtime的proc.go文件中。

func schedinit() {
   //lockInit  锁相关的初始化 暂时忽略

   //获取当前的g 之前已经保存在tls中了,getg就是从tls中获取
   //大致的关系是fs -> tls[1] -> g() -> tls[0] -> g0 -> g0.m0 = &m0 -> m0.g0 = &g0
   //从fs段寄存器出发 找到 m0.tls[1] ,地址-8后得到 tls[0] 而 tls[0]正好指向g0获取到
   _g_ := getg()
   if raceenabled { //如果启用了race 则进行raceinit的初始化,默认false
      _g_.racectx, raceprocctx0 = raceinit()
   }

   //默认m(线程)的最大值是10000个,面试经常问
   sched.maxmcount = 10000

   // The world starts stopped.
   worldStopped() //用于lock rank,可忽略

   moduledataverify() //验证链接器符号,可忽略
   //初始栈,就是初始 stackLarge,stackpool 两个全局变量。对这哥俩感兴趣的可以看上篇博文 内存管理
   //注意这里还没有给栈分配内存
   stackinit()
   //内存分配初始化。就是计算内存大小,初始化mheap,mcache0 等操作
   mallocinit()
   //初始化CPU相关的参数
   //读取环境变量GODEBUG,并调用 internal/cpu.Initialize
   cpuinit()      // must run before alginit
   //map使用必须调用,算法相关
   alginit()      // maps, hash, fastrand must not be used before this call
   //随机数相关
   fastrandinit() // must run before mcommoninit
   //初始化m,调用atomicstorep将m0放入全局变量allm
   //并且将allm挂到m的alllink上
   mcommoninit(_g_.m, -1)
   //模块初始化,将所有模块的moduledata的gc标志初始化,并将moduledata放入全局变量modulesSlice中
   modulesinit()   // provides activeModules
   //type这种别名相关的,消除重复映射
   typelinksinit() // uses maps, activeModules
   //接口相关,将每个模块的itab 放入全局变量itabTable.entries中,方便动态派发
   //itab粗糙的理解 = 接口类型+具体实现类型,方便动态类型的查找。
   itabsinit()     // uses activeModules
   //初始化methodValueCallFrameObjs栈对象 
   stkobjinit()    // must run before GC starts

   //将当前线程信号保存到m.sigmask中,一并设置到全局变量initSigmask
   sigsave(&_g_.m.sigmask)
   initSigmask = _g_.m.sigmask
   ...
   
   goargs() //入参全局变量argslice初始化
   goenvs() //环境全局变量envs初始化
   parsedebugvars() //初始化debug包变量,并根据环境变量GODEBUG解析dbgvars的一系列配置
   gcinit()  //gc相关

   lock(&sched.lock)
   //sched.lastpoll 设置调度器初始化轮训时间
   sched.lastpoll = uint64(nanotime())
   //设置当前cpu个数,在 osinit() 函数里已经获取到。如果环境变量GOMAXPROCS设置了CPU个数,直使用设置个数。
   procs := ncpu
   if n, ok := atoi32(gogetenv("GOMAXPROCS")); ok && n > 0 {
      procs = n
   }
   //调整cpu 数量
   if procresize(procs) != nil {
      throw("unknown runnable goroutine during bootstrap")
   }
   unlock(&sched.lock)

   ...
   // World is effectively started now, as P's can run.
   worldStarted()

}

mainPC main newproc

上面汇编中将runtime·mainPC作为runtime.newproc的参数,即回调用函数参入。

而上面说的rt0_go函数中还有一段,这里将mainPC指向了main

DATA    runtime·mainPC+0(SB)/8,$runtime·main<ABIInternal>(SB)
GLOBL  runtime·mainPC(SB),RODATA,$8

先看newproc 函数,在runtime的proc.go文件中

//创建一个新的g,绑定main函数,并且加入到队列中等待执行
func newproc(fn *funcval) {
   gp := getg()         //获取当前g
   pc := getcallerpc()  //获取程序计数器
   systemstack(func() {
      //创建新的g并绑定fn,也就是main
      newg := newproc1(fn, gp, pc)
      
      _p_ := getg().m.p.ptr()
      //推入p的队列中
      runqput(_p_, newg, true)

      //是否启动M开始执行
      //默认为false,在下面的main函数中设置mainStarted=true,所以第一次到这里是不会执行的。
      if mainStarted {
         wakep()
      }
   })
}
  • 这里相当于将runtime·main推到p的队列中
  • golang中go statement入口就是newproc,即go func(){}实际上newproc(func(){})的调用

main函数,同样在这个文件里

func main() {
   g := getg()
   g.m.g0.racectx = 0

   //设置栈的最大值,按处理器位数,64位对应1G,32位对应250MB
   if goarch.PtrSize == 8 {
      maxstacksize = 1000000000
   } else {
      maxstacksize = 250000000
   }

   maxstackceiling = 2 * maxstacksize

   mainStarted = true //允许上面的newproc函数创建Ms
   ...
   //执行每runtime的init
   doInit(&runtime_inittask) // Must be before defer.
   
   ...

   gcenable() //开启gc

   //下面一大坨都是cgo相关
   main_init_done = make(chan bool)
   if iscgo {
   ...
   }

   doInit(&main_inittask) //执行package main的init
   ...
   
   fn := main_main // 执行package main中主函数
   fn()

   ...

   exit(0)  //退出进程
}

这里着重说一下doInit函数,它会执行每个模块中的init函数,init函数对应结构体如下:

type initTask struct {
   state uintptr //状态标识 0:未执行, 1:执行中, 2:已完成 
   ndeps uintptr //当前模块的其他依赖
   nfns  uintptr //模块里面的几个init函数
}

看这个结构就能猜到,所有的init函数会根据模块的依赖关系形成一个有向无环图,执行的过程就是对这个图进行深度优先遍历,遍历函数doInit如下

func doInit(t *initTask) {
   switch t.state {
   case 2: // 完成退出
      return
   case 1: // 异常panic
      throw("recursive call during initialization - linker skew")
   default: // 遍历执行
      t.state = 1 // 先设置状态到执行中

      //向下递归
      for i := uintptr(0); i < t.ndeps; i++ {
         p := add(unsafe.Pointer(t), (3+i)*goarch.PtrSize)
         t2 := *(**initTask)(p)
         doInit(t2)
      }

      //当前模块没init则设置状态到完成,返回
      if t.nfns == 0 {
         t.state = 2 // initialization done
         return
      }
      ... //执行当前模块的init,完成后设置状态2 返回
      t.state = 2
   }
}

mstart

mstart函数汇编中指向mstart0

TEXT runtime·mstart(SB),NOSPLIT|TOPFRAME,$0
   CALL   runtime·mstart0(SB)
   RET // not reached

mstart0这个函数同样在proc.go文件里

func mstart0() {
   ...
   mstart1() // 启动m
   //退出当前线程
   if mStackIsSystemAllocated() {
      osStack = true
   }
   //执行完所有的 Goroutine 后,清理并退出m,不会执行到这里
   mexit(osStack)
}


func mstart1() {
   ...
   asminit()
   minit() //初始化新的m,在新线程上调用
   ...
   schedule() //开始调度,找到一个`runnable`状态的goroutine并执行
}

尾语

至此,一整个go的启动流程就串起来了。

再声明一下,博主用的mac环境1.18.4go版本,不同的版本会有稍有差异,尤其是go1.12到1.18内容变动还是比较多的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值