大名鼎鼎的 Linux —— 进程,自学Linux运维

程序是什么?


计算机程序(英语:Computer Program)是指一组指示电子计算机或其他具有消息处理能力设备每一步动作的指令,通常用某种程序设计语言编写,运行于某种目标体系结构上

上面是维基百科给出的解释,我们能把程序初步理解为一组 CPU指令集合

我们平时使用编程语言写的代码 (C,java,php,go…),也叫程序,本质上就是一堆字符串。只不过人类写的字符串 CPU 理解不了,CPU 能理解的东西不是正常人能写的,因此在我们写的程序和CPU能执行的指令之间,存在一种转换关系

这种转换关系通过 编译器/解释器 来实现

编译器

test.c

#include<stdio.h>

int main()

{

printf(“hello world\n”);

return 0;

}

复制代码

首先这是一个 C语言程序,一个文本文件,位于磁盘的某个角落,CPU 肯定是看不懂的,所以需要做一层转换

gcc test.c -o test

gcc 就是一种编译器,把 C的文本程序转化为 ELF(Executable and Linkable Format)文件,并不是你所认为的二进制文件(binary)

ELF 文件也是一种可执行文件,其中也包含二进制内容,除此之外还有一些其他的信息

gcc 编译后的为 ELF 文件

image.png

go 编译后的二进制文件

image.png

解释器

解释器是一种直接执行高级语言代码的计算机程序, 而无需将代码编译成机器码

  • 优点: 消除了编译整个程序的负担,程序可以拆分成多个部分来模块化

  • 缺点: 解释器像是一位“中间人”,每次运行程序时都要先将代码转成另一种语言的代码,然后再作运行,因此解释器的程序运行速度比较缓慢

解释器执行代码的策略一般有以下三种:

  • 直接运行高级编程语言的代码(如 shell 内置的解释器 or php 的解释器)

  • 先将代码转换成高效的中间码(如:php opcode),然后马上执行(不输出中间码,如 PHP-FPM 的执行)

  • 由解释器中内置的编译器先将高级语言的代码编译成中间码,然后再执行(输出中间码,相当于两个阶段,如 javac 先把源码编译成字节码,然后用 jvm 执行字节码)

image.png

不懂就问:先有编译器还是先有编程语言?

CPU 能识别的指令又叫做机器语言,格式为二进制的。假如 0000 表示 LOAD , 0001 表示 STORE

最开始的程序主要是为了做数学计算,初代程序员直接写机器指令运行 CPU,但是机器指令太反人类了,于是有个聪明的人说我用机器语言写一个程序,这个程序能干一件事:我把一个文件里的 LOAD 字符能转化成 0000,把STORE 字符转化成 0001(简单举个例子,实际 LOAD 不是 0000)

这个程序是通过机器语言写的,我们把这个程序叫做编译器,把包含 LOAD,STORE 等指令的语言叫做汇编语言,把字符转换的过程叫做汇编过程

那现在我们能通过汇编语言写出 CPU 能执行的代码,那之前那个编译器,我是不是还可以用汇编语言重新写一次?

汇编语言只是简单的通过指令转换,用一些汇编指令标识一系列的机器指令,但是还是很难写,能不能搞出一种正常人能写的编程语言?

那就设计一种语言吧!

C是一种通用的编程语言,广泛用于系统软件应用软件的开发。于1969年至1973年间,为了移植与开发UNIX操作系统,由丹尼斯·里奇肯·汤普逊,以B语言为基础,在贝尔实验室设计、开发出来

其实 C 语言和汇编之间还有一段历史,但是 C 语言由于其设计的优越性,被人们广泛运用。C语言的第一个编译器,是用 B 语言写的。看了上面你肯定知道 B 语言也是更低级的语言,其实编译器和编程语言的诞生,都是按照上面的逻辑

最后,上文使用的 gcc 编译器不是通过汇编写的,也不是通过 B 语言写的,而是通过 C/C++ 写的(当今时代的 gcc)

进程与程序

上文讲了一堆,无非是想搞清楚我们当前所使用的高级程序语言是如何一步步变成 CPU 所理解的机器语言,但是无论怎么转化,都始终只是硬盘里的一个文本文件,只有当真正执行的时候,才能成为操作系统里的一个进程

程序能执行起来,肯定不是你的功劳,实际上是你只是双击了两下程序图标,真正执行起程序的程序叫做操作系统

  1. 当我们双击程序图标或者键入程序名字后,操作系统根据程序的名字去磁盘中找到可执行程序

  2. 操作系统在内存为即将要运行的程序划出一块区域

  3. 操作系统将找到的可执行程序,然后从磁盘中程序信息copy到刚刚划分出的内存区域当中

  4. 操作系统在内存中找到可执行程序代码段的起始位置,假设这个地址是A

  5. 操作系统告诉CPU从A这个位置开始执行(其实没有这么简单)

我们现在知道程序运行起来以后就是一个进程,进程运行在内存里,那在这一块内存里,到底有哪些东西?我们能看到吗?

Linux 有一种哲学思想叫做一切皆文件,其实进程在 Linux 里面也会被抽象成文件的概念

/proc/pid

执行 ./test,然后 ps -ef,找到刚刚运行的进程号为 1100

image.png

cd /proc/1100 然后 ls -alh,你会发现一堆目录和文件

image.png

简单解释一下 /proc 目录,/proc 文件系统是一种虚拟文件系统,以文件系统目录和文件形式,提供一个指向内核数据结构的接口,通过它能够查看和改变各种系统属性。/proc 里面的数字开头的文件夹,就是当前系统中所运行的进程信息

进到进程目录里面能看到一堆和进程相关的数据:

  • cwd 软链接,指向进程工作目录

  • exe 软链接,指向进程的执行地址

  • fd 目录,存放进程打开的文件描述符

  • fdinfo 目录,存放进程打开的文件描述符的信息

  • maps 文件,进程打开相关文件的内存映射(比如 mmap 系统调用)

  • status 文件,保存进程的状态 running、sleep、ready 等

  • limits 文件,存放进程相关的一些限制条件 max open files 限制文件描述符的个数

  • environ 文件,存放环境变量

  • io 文件,记录进程 io 时读取的字节数

  • task 目录,这个目录很重要,因为里面放的每个目录对应的就是一个线程

好了,至此应该知道一个进程执行时,操作系统会为程序分配内存,会记录程序各种各样的信息。而具体执行的东西是 task 目录下的线程。

可以理解为进程就像是一个环境,这个环境里有各种各样的资源,cpu 具体执行的是 task 目录下的线程,这些线程共享进程资源。单线程的程序 task 目录就一个线程,多线程的的程序 task 目录就有多个线程

执行 ps -efT,PID 为进程 ID,SPID 为线程 ID,下面是 redis 启动时,开启的线程数

image.png

操作系统眼中的进程是怎样的?


对于每个进程而言,大家都是相互独立的,你写的程序是不可能访问其他进程地址的数据和指令

因此操作系统为了隔离进程,给每个进程创建出了一个虚拟地址空间,意思是在每个进程都以为自己独立拥有整块内存,进程中的指令跳转、数据访问所使用的地址都是虚拟地址,因此不同的进程之间是不可能互相访问的

而实际上进程的数据是保存在物理内存的,因此每个进程的地址空间和物理内存之间存在一种映射关系,这种关系保存在每个进程的页表

image.png

在操作系统眼里,用户程序是一个充满了bug随时会崩溃的定时炸弹(必须承认,我们写的代码里藏有很多bug…),或者干脆就是某些天才程序员用来恶意控制整个计算机的破坏者。

操作系统面对的就是这样一个恶劣的环境。因此作为操作系统,应该把用户程序当做囚犯一样关在牢笼里面。

#include<stdio.h>

int main()

{

printf(“hello world\n”);

return 0;

}

复制代码

再看一下上面的 test.c 程序,就干了一件事,打印 hello world 到标准输出(默认是控制台),这个过程是需要用户程序、操作系统、硬件三方合作才能完成的。

image.png

首先程序运行,当前处于用户态,然后代码执行到 printf 时,这里用户程序发起 write 系统调用,系统调用时会发出软中断(0x80),让CPU 执行环境由用户态变为内核态,接下来内核执行 writev 系统调用对应的处理逻辑以及用户程序的传参,调用硬件驱动把数据写到控制台

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Linux运维工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Linux运维全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Linux运维知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加VX:vip1024b (备注Linux运维获取)
img

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

  • 9
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值