大名鼎鼎的 Linux —— 进程,线程,协程(1),五面阿里拿下飞猪事业部offer

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Linux运维全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上运维知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip1024b (备注运维)
img

正文

gcc 编译后的为 ELF 文件

image.png

go 编译后的二进制文件

image.png

解释器

解释器是一种直接执行高级语言代码的计算机程序, 而无需将代码编译成机器码

  • 优点: 消除了编译整个程序的负担,程序可以拆分成多个部分来模块化

  • 缺点: 解释器像是一位“中间人”,每次运行程序时都要先将代码转成另一种语言的代码,然后再作运行,因此解释器的程序运行速度比较缓慢

解释器执行代码的策略一般有以下三种:

  • 直接运行高级编程语言的代码(如 shell 内置的解释器 or php 的解释器)

  • 先将代码转换成高效的中间码(如:php opcode),然后马上执行(不输出中间码,如 PHP-FPM 的执行)

  • 由解释器中内置的编译器先将高级语言的代码编译成中间码,然后再执行(输出中间码,相当于两个阶段,如 javac 先把源码编译成字节码,然后用 jvm 执行字节码)

image.png

不懂就问:先有编译器还是先有编程语言?

CPU 能识别的指令又叫做机器语言,格式为二进制的。假如 0000 表示 LOAD , 0001 表示 STORE

最开始的程序主要是为了做数学计算,初代程序员直接写机器指令运行 CPU,但是机器指令太反人类了,于是有个聪明的人说我用机器语言写一个程序,这个程序能干一件事:我把一个文件里的 LOAD 字符能转化成 0000,把STORE 字符转化成 0001(简单举个例子,实际 LOAD 不是 0000)

这个程序是通过机器语言写的,我们把这个程序叫做编译器,把包含 LOAD,STORE 等指令的语言叫做汇编语言,把字符转换的过程叫做汇编过程

那现在我们能通过汇编语言写出 CPU 能执行的代码,那之前那个编译器,我是不是还可以用汇编语言重新写一次?

汇编语言只是简单的通过指令转换,用一些汇编指令标识一系列的机器指令,但是还是很难写,能不能搞出一种正常人能写的编程语言?

那就设计一种语言吧!

C是一种通用的编程语言,广泛用于系统软件应用软件的开发。于1969年至1973年间,为了移植与开发UNIX操作系统,由丹尼斯·里奇肯·汤普逊,以B语言为基础,在贝尔实验室设计、开发出来

其实 C 语言和汇编之间还有一段历史,但是 C 语言由于其设计的优越性,被人们广泛运用。C语言的第一个编译器,是用 B 语言写的。看了上面你肯定知道 B 语言也是更低级的语言,其实编译器和编程语言的诞生,都是按照上面的逻辑

最后,上文使用的 gcc 编译器不是通过汇编写的,也不是通过 B 语言写的,而是通过 C/C++ 写的(当今时代的 gcc)

进程与程序

上文讲了一堆,无非是想搞清楚我们当前所使用的高级程序语言是如何一步步变成 CPU 所理解的机器语言,但是无论怎么转化,都始终只是硬盘里的一个文本文件,只有当真正执行的时候,才能成为操作系统里的一个进程

程序能执行起来,肯定不是你的功劳,实际上是你只是双击了两下程序图标,真正执行起程序的程序叫做操作系统

  1. 当我们双击程序图标或者键入程序名字后,操作系统根据程序的名字去磁盘中找到可执行程序

  2. 操作系统在内存为即将要运行的程序划出一块区域

  3. 操作系统将找到的可执行程序,然后从磁盘中程序信息copy到刚刚划分出的内存区域当中

  4. 操作系统在内存中找到可执行程序代码段的起始位置,假设这个地址是A

  5. 操作系统告诉CPU从A这个位置开始执行(其实没有这么简单)

我们现在知道程序运行起来以后就是一个进程,进程运行在内存里,那在这一块内存里,到底有哪些东西?我们能看到吗?

Linux 有一种哲学思想叫做一切皆文件,其实进程在 Linux 里面也会被抽象成文件的概念

/proc/pid

执行 ./test,然后 ps -ef,找到刚刚运行的进程号为 1100

image.png

cd /proc/1100 然后 ls -alh,你会发现一堆目录和文件

image.png

简单解释一下 /proc 目录,/proc 文件系统是一种虚拟文件系统,以文件系统目录和文件形式,提供一个指向内核数据结构的接口,通过它能够查看和改变各种系统属性。/proc 里面的数字开头的文件夹,就是当前系统中所运行的进程信息

进到进程目录里面能看到一堆和进程相关的数据:

  • cwd 软链接,指向进程工作目录

  • exe 软链接,指向进程的执行地址

  • fd 目录,存放进程打开的文件描述符

  • fdinfo 目录,存放进程打开的文件描述符的信息

  • maps 文件,进程打开相关文件的内存映射(比如 mmap 系统调用)

  • status 文件,保存进程的状态 running、sleep、ready 等

  • limits 文件,存放进程相关的一些限制条件 max open files 限制文件描述符的个数

  • environ 文件,存放环境变量

  • io 文件,记录进程 io 时读取的字节数

  • task 目录,这个目录很重要,因为里面放的每个目录对应的就是一个线程

好了,至此应该知道一个进程执行时,操作系统会为程序分配内存,会记录程序各种各样的信息。而具体执行的东西是 task 目录下的线程。

可以理解为进程就像是一个环境,这个环境里有各种各样的资源,cpu 具体执行的是 task 目录下的线程,这些线程共享进程资源。单线程的程序 task 目录就一个线程,多线程的的程序 task 目录就有多个线程

执行 ps -efT,PID 为进程 ID,SPID 为线程 ID,下面是 redis 启动时,开启的线程数

image.png

操作系统眼中的进程是怎样的?


对于每个进程而言,大家都是相互独立的,你写的程序是不可能访问其他进程地址的数据和指令

因此操作系统为了隔离进程,给每个进程创建出了一个虚拟地址空间,意思是在每个进程都以为自己独立拥有整块内存,进程中的指令跳转、数据访问所使用的地址都是虚拟地址,因此不同的进程之间是不可能互相访问的

而实际上进程的数据是保存在物理内存的,因此每个进程的地址空间和物理内存之间存在一种映射关系,这种关系保存在每个进程的页表

image.png

在操作系统眼里,用户程序是一个充满了bug随时会崩溃的定时炸弹(必须承认,我们写的代码里藏有很多bug…),或者干脆就是某些天才程序员用来恶意控制整个计算机的破坏者。

操作系统面对的就是这样一个恶劣的环境。因此作为操作系统,应该把用户程序当做囚犯一样关在牢笼里面。

#include<stdio.h>

int main()

{

printf(“hello world\n”);

return 0;

}

复制代码

再看一下上面的 test.c 程序,就干了一件事,打印 hello world 到标准输出(默认是控制台),这个过程是需要用户程序、操作系统、硬件三方合作才能完成的。

image.png

首先程序运行,当前处于用户态,然后代码执行到 printf 时,这里用户程序发起 write 系统调用,系统调用时会发出软中断(0x80),让CPU 执行环境由用户态变为内核态,接下来内核执行 writev 系统调用对应的处理逻辑以及用户程序的传参,调用硬件驱动把数据写到控制台

类似的系统调用有很多,因此我们的应用程序很多时候都是在用户态和内核态之间进行一种切换。操作系统必须要保证硬件资源的合理利用,以及对各种硬件的合理访问。因此,对它而言用户程序是不可被信任的,因此对于硬件的操作都需要封装成系统调用,提供给用户程序,不会让用户程序直接操作

操作系统眼中的线程是怎样的?


上面看进程信息的时候已经说到了 task 目录,基本上大家就知道了进程和线程的关系了,为了更清晰的了解线程,首先看一下一个程序是怎么运行的

image.png

  • 程序是怎么运行的?

  • 很简单,把 main 函数地址放到 CPU 的 PC 寄存器就行

  • 什么是 PC 寄存器?

  • PC 寄存器存放CPU 即将执行的下一条指令的地址

  • 为什么要把 main 函数地址放到 PC 寄存器?

  • 因为 main 函数是程序的入口

  • 那我放其他函数的地址可不可以?

  • 当然可以,因为线程就是这么设计的

当我们把PC寄存器指向非 main 函数时,线程就诞生了

image.png

当然我 fork 一个线程肯定不是只为了执行一个函数,因此每个线程都会有自己独立的栈区以及寄存器组。当发生线程切换的时候,因为线程间共用进程地址,因此不需要切换进程上下文,只需要保存当前线程的数据以及执行到哪条指令,然后把 CPU 的 PC 寄存器指向下一个线程的执行地址就行

image.png

轻量级进程

其实对于cpu调度而言,操作系统调度的对象实际上是 /proc/$pid/task 目录的对象,线程和进程的区别无非是地址空间是独立的还是共享的,因此内核会为每个 task 对象创建一个 task_struct 结构体,这个结构体叫进程描述符。这些 task 对象拿到 cpu 时间片后,只有在时间片使用完、IO 阻塞、亦或者产生硬中断等外部条件时,才会暂停运行,也就是说线程是不会主动让出 cpu 时间片的,他们之间属于竞争关系

从 Linux 内核的角度看,它使用轻量级进程对多线程应用提供支持,其实它的创建也是基于fork()系统调用,只是在进程描述符的初始化当中有所区别。首先,轻量级进程也是一个进程,它有它自己的pid,有它自己的内核栈和进程描述符,甚至还有它自己的调度策略,而轻量级进程和普通进程不同的就是它没有自己的进程地址空间,并且要响应线程组内其他线程接收到的信号(但可以通过修改信号屏蔽字屏蔽某些信号)。轻量级进程使用的是父进程的内存地址空间,也就是在task_struct结构中的内存指针指向父进程的内存地址。而信号描述符指针会指向父进程指向的地址。而在应用层,线程有自己的栈

轻量级进程和普通进程区别:

  • 没有自己的进程地址空间,使用父进程的进程地址空间
  • 与组内所有进程共享信号,但有自己的信号屏蔽字

协程是什么?

======

上面说到线程之间是竞争关系,线程不会主动让出 cpu 时间片,因此当系统中的线程越来越多的时候,操作系统为了让每个线程都有机会执行,会频繁的进行线程切换。线程切换的代价比进程切换要少很多,因为各个线程之间共享进程地址空间,共享内存,共享全局数据等,因此只需要保存当前线程的局部变量,数据,以及 pc 寄存器的值,然后加载新线程的资源即可

用户态线程


对于 web 应用而言,线程切换最频繁的场景就在于 IO 了。当 IO 阻塞时,操作系统会挂起线程,然后让其他线程执行,不会让 cpu 傻傻等着

线程切换无非是改变 CPU 下一条指令执行的地址,那我们能不能在应用程序的用户态做到?

function main()

{

A();

B();

C();

}

function A()

{

//IO Blocking

}

function B()

{

//IO Blocking

}

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注运维)
img

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip1024b (备注运维)
[外链图片转存中…(img-LP14MYEf-1713551072905)]

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 26
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值