操作系统_学习记录_操作系统中物理记录与记录-CSDN博客

本文链接：https://blog.csdn.net/qq_42659654/article/details/124459647

提示：记录操作系统的学习

文章目录

进程和线程的区别
进程有哪些通信方式？
简单讲讲僵尸进程和孤儿进程
malloc是如何分配内存的？
总结

进程和线程的区别

关键字：资源、调度、开销、通信

资源：
- 进程是指运行中的程序，线程是资源分配的基本单位，线程可以访问隶属于进程下的资源
调度
- 线程是独立调度的基本单位，线程是进程当中的一条执行流程；同一个进程下的线程的切换不会引起进程的切换，但从一个进程中的线程切换到另一个进程的线程会引起进程切换
开销：
- 线程的创建时间比进程快，因为进程的创建的过程中，系统需要配置资源管理信息，比如内存管理信息、文件管理信息，而线程在创建的过程中可以共享进程的内存管理信息和文件管理信息，所以线程创建时间比进程快；
- 线程的终止时间比进程快，因为线程释放的资源相比进程少
- 同一个进程内不同线程切换比进程切换快，因为同进程下的不同线程间共享属于进程的虚拟地址空间，具有同一个页表，同进程下的线程间切换不需要页表切换；而进程切换需要切换页表，并且页面切换开销较大；
通信：
- 线程间可通过直接读写同进程中的数据进行通信，而进程间通信需要借助IPC

进程有哪些通信方式？

每个进程的用户地址空间都是独立的，所以进程间交换数据需要通过内核，将数据拷贝到内核中，然后另一个进程从内核将数据拷贝出进行读取，这就是进程间通信。（内核中进程是共享的）
秒回：管道、消息队列、共享内存、信号量、信号、Socket

管道：
- 管道是一种半双工的通信方式，数据只能单向流动，通信数据无格式且大小受限；
- 管道通信效率低，不适合进程间频繁交换数据
消息队列
- 消息队列是保存在内核中的消息链表，比如A进程给B进程发送消息，A进程把数据放入消息队列就可以正常返回，B进程从消息队列中读取消息；
- 但存在通信不及时和消息大小受限的问题，消息队列不适合数据量大的传输；并且每次数据的写入和读取都需要经过用户态和内核态之间的数据拷贝过程
共享内存
- 共享内存不同虚拟地址空间能映射到相同的物理地址空间中，该内存由一个进程创建，多个进程共享访问。与信号量配合使用，可以实现进程间的同步和通信
- 但存在着多个进程竞争共享资源，可能会造成数据错乱问题
信号量
- 信号量提供了数据保护机制；信号量是一个整型计数器，主要用于实现进程间的互斥和同步；
- 有互斥信号量（信号初始化为1）和同步信号量（信号初始化为0）两种
信号
- 信号能有效的应对异常情况下的工作模式，通过信号通知进程；唯一的异步通信机制
- Ctrl + C：终止进程
- Ctrl + Z：停止进程，但并未结束
- Kill -9 PID：立即结束进程
Socket
- 实现不同网络下的不同主机间的进程通信
- int socket(int domain, int type, int protocol)

简单讲讲僵尸进程和孤儿进程

当父进程通过fork()函数创建子进程，创建完毕后父子进程独立运行，父进程无法预知子进程什么时候结束；
正常情况下，子进程退出后，父进程就调用wait()或waitpid()函数回收子进程；子进程的结束和父进程的运行是一个异步过程
但会存在着父进程先结束，导致子进程成为了孤儿进程，孤儿进程会被init进程（进程号为1）领养，孤儿进程最终由init进程循环调用wait函数来释放资源；
还可能存在着，子进程先与父进程退出，但父进程由于由于忙碌，没有挥手子进程的资源，此时子进程残留在内核中，变成僵尸进程；
僵尸进程会一直占用着进程号，大量的僵尸进程会导致无可用进程号；

解决方法
- 僵尸进程是无法通过kill 进程号的方式杀死，但是可以kill父进程，使得僵尸进程交由init进程领养，并调用wait()函数释放进程号等资源
- 可以通过两次调用fork()函数，父进程创建子进程，父进程继续运行，子进程创建孙子进程后，子进程退出，孙子进程就会由init进程领养，并进行回收

malloc是如何分配内存的？

malloc是用于动态内存分配的，那么首先需要知道动态分配的内存位于什么位置，也就是需要知道Linux进程的内存如何分布，动态内存如何获取等相关知识；
用户空间内存从低到高分别是6种不同的内存段：程序文件段、已初始化数据段、未初始化数据段、堆段、文件映射段、栈段；其中堆段和文件映射段的内存是动态分配的，malloc分配内存主要就和堆段和文件映射区密切相关。

malloc是如何分配内存的？

malloc不是系统调用，而是C中的库函数，用于动态内存分配。malloc申请内存时，采用两种方式向操作系统申请内存：

方式一：通过brk()系统调用从堆分配内存
方式二：通过mmap()系统调用在文件映射区域分配内存

方式一：通过brk()函数将堆顶指针向高地址方向移动，获得新的内存空间。
方式二：通过mmap()函数系统调用中以私有匿名映射的方式，在文件映射区分配一块内存。
这两种的调用时机默认情况下是看用户分配的内存大小，如果内存大小小于128kB时，则通过调用brk()函数调用申请堆内存；否则，通过调用mmap()函数调用申请文件映射区内存；

malloc()分配的是物理内存吗？

malloc()分配的内存是虚拟内存。
如果分配后的虚拟地址没有被访问，不存在着虚拟内存到物理内存之间的映射，此时不会占用物理内存；
但当进行访问（读写）已分配的虚拟内存时，操作系统通过查询页表，发现虚拟内存对应的页在物理内存中不存在，触发缺页中断，然后操作系统会建立虚拟内存到物理内存之间的映射关系。

malloc(1)会分配多大的内存？

malloc()分配内存时，会预分配更大的空间作为内存池；

free释放内存，会归还操作系统资源吗？

如果是通过malloc中的brk()方式分配的内存，调用free函数后堆内存还存在，并未归还操作系统，而是先缓存进malloc的内存池中，当进程再次申请小于该内存空间大小的时候，就可以直接复用该内存；
如果是通过malloc中的mmap()方式分配的内存，调用free函数后内存得到真正释放，并归还给操作系统；

为什么不全部使用mmap来分配内存

通过mmap()分配内存需要系统调用，也就是从用户态到内核态的切换，然后再从内核态到用户态的切换，存在着两次运行态的切换，时间开销大；
另外，mmap()分配的内存每次释放后都会归还给操作系统，也就是第一次访问mmap分配的虚拟内存都会发送缺页中断，CPU开销大；
总之，频繁通过mmap()分配内存，不仅每次都会发送运行态的切换，而且第一次访问虚拟内存都会触发缺页中断，CPU开销大；
因此，采用brk()分配内存时，分配内存时操作系统预分配更大的内存来作为内存池，free()释放内存后仍保留在内存池中；当再次申请内存时，直接从内存池中取出对应内存快，而且可能该内存块对应的虚拟地址和物理地址之间的映射关系还存在，不仅减少了系统调用的次数，而且减少了缺页中断的次数，明显降低了CPU的消耗；

为什么不全部用brk()分配内存？

因为通过brk()分配的内存，free该内存后并不会归还给操作系统，而是缓存在内存池中。如果连续申请了10k、20k、30k的三块内存，并且10k和20k内存被释放了，变成了空闲内存空间，如果下次申请的内存小于30k，该空闲内存空间可以复用；但是，如果申请的内存大于30k，系统需要额外开销新的堆内存；
此类操作，会导致小块内存无法被利用，最终导致堆内存产生了越来越多的内存碎片，而且valgrind工具无法检测出内部碎片；
所以brk()和mmap()两种方式的相辅相成的。