一个详细介绍CPU & Memory & Kernel的博客

最新推荐文章于 2022-04-15 11:37:46 发布

iteye_8623

最新推荐文章于 2022-04-15 11:37:46 发布

阅读量186

点赞数

http://duartes.org/gustavo/blog/category/software-illustrated

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_8623

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Linux Kernel 之一内核架构、源码文件、API/ABI 介绍、FHS

技术干货

12-07

3163

内核架构主要有宏内核（Monolithic Kernel）、微内核（Micro kernel）和混合内核（Hybrid kernel）三种。Linux 系统的 Kernel 属于宏内核，而 Windows 系统的内核 Windows NT 和 macOS 的内核 XNU 都属于混合内核。

Kernel: 内存控制参数 memory cgroup/ kernel memory leak

mzhan017的博客

11-04

1052

/sys/fs/cgroup/memory/kubepods.slice/kubepods-burstable.slice/kubepods-burstable-pod55c9f3ea_59cd_49a3_a52c_b29c9ca14e8c.slice [root@]# ls -ltrh total 0 -rw-r--r--. 1 root root 0 Sep 14 09:49 memory.limit_in_bytes //可以通过此文件控制当前cgroup的内存限制 drwxr-xr-x. 2

参与评论您还未登录，请先登录后发表或查看评论

cpu hotplug 架构 --- Linux Kernel 实现之美

500

01-19

3015

cpu从offline到online 是一个循序渐进的过程,崎岖坎坷, 包含了时钟、软中断、cpufreq … 多个模块的处理, 就像一个人跨越社会阶层一样. 不是一蹴而就的. ok, 如果你偏要杠精说女生嫁人实现跃迁是一蹴而就, 那应该是生育议价权的原因, 学习高考从村庄到城市的跃迁是十年学习的过程, 彩票一夜暴富实现财富突然增长绝对不是, … ...

【Linux】Linux Kernel--Memory Management(二)

moxiaomomo的专栏

12-04

1798

3.6 Demand Paging 　只要执行映像映射到进程的虚拟内存中，它就可以开始运行。因为只有映像的最开始的部分是放在物理内存中，很快就会访问到还没有放在物理内存的虚拟空间区。当进程访问没有有效页表条目的虚拟地址的时候，处理器向Linux报告page fault。Page fault描述了发生page fault的虚拟地址和内存访问类型。　 Linux必须

CUDA编程指南阅读笔记（二）

余音绕梁九日的专属空间站

08-15

2421

3. CUDA基本概念（下） 3.3 内存层次（Memory Hierarchy）在GPU上CUDA线程可以访问到的存储资源有很多，每个CUDA线程拥有独立的本地内存（local Memory）；每一个线程块（block）都有其独立的共享内存（shared memory），共享内存对于线程块中的每个线程都是可见的，它与线程块具有相同的生存时间；同时，还有一片称为全局内存（glob

Shell | 查看CPU型号、kernel版本号及其源代码等方法的不完全总结

MissMango0820的博客

03-27

3361

本文总结如何查看Linux kernel版本号的几种方法和以此查看源代码。

kernel内存、地址

ivychend的博客

04-08

2504

1 物理地址、虚拟地址、总线地址 2 编址方式 2.1 外设访问 2.1.1 映射 3 虚拟地址映射 4 内存布局 4.1 动态映射区 4.2 永久映射区 4.3 固定映射区 4.4 high memory 4.5 DMA 4.6 实际内存布局 5 /proc/目录下的内存结点 5.1 iomem 5.2 meminfo 5.3 vmallocinfo 6 分配内存函数 6.1 ...

kernel/userspace shared memory driver-开源

05-04

“mbuff.o”模块是一个内核驱动程序，它实现了内核空间和用户空间之间的直接内存共享。这个模块的核心功能是利用`vmalloc`函数在内核中动态分配内存，并将其映射到用户空间，使得内核和用户进程可以直接访问同一块...

percpu-km.rar_memory

09-24

在Linux内核中，内存管理是至关重要的一个部分，它涉及到系统资源的有效分配与回收，以确保系统的稳定性和性能。"percpu-km.rar_memory"这个压缩包关注的是基于内核内存的分块分配，主要涉及到`percpu-km.c`源代码...

Meltdown- Reading Kernel Memory from User Space.pdf

03-14

通常情况下，处理器会使用一个“监督位”来实现这一隔离，当进入内核代码执行时，该监督位被设置，而当返回用户空间时，监督位被清除，从而在硬件层面保障了隔离性。然而，为了提升性能，现代的CPU采用了乱序执行...

【Linux】Linux Kernel--Memory Management(一)

moxiaomomo的专栏

12-03

3258

内存管理子系统是操作系统的重要部分。从计算机发展早期开始，就存在对于大于系统中物理能力的内存需要。为了克服这种限制，开发了许多种策略，其中最成功的就是虚拟内存。虚拟内存通过在竞争进程之间共享内存的方式使系统显得拥有比实际更多的内存。虚拟内存不仅仅让你的计算机内存显得更多，内存管理子系统还提供： Large Address Spaces（巨大的地址空间）操作系统使系统显得拥有比实际更大

Memory和CPU性能分析总结

zhuolimin78的专栏

03-20

3629

Memory和CPU性能分析总结一、开机时间为3:20, 开机2分钟到10分钟cup利用率和memory的使用率如下图所示：二、在终端敲入adb shell top -m 12收集到的运行最活跃的10(除去adb 和 top 这两个进程)个进程，数据如下：数据一: PIDPR CPU% S #THR V

Intel处理器MSR学习

李迟的专栏

02-25

1万+

Intel IA32软件开发者手册第3卷第35章中介绍了MSR。但是，该章节并没有十分详细地描述，基本上就给出一个地址并作简单说明。而网络上能搜索到文章，也是点到即止。本文结合IA32开发手册，以及coreboot代码，概要地整理一下这方面的知识。用实例来展示MSR用途。

OC_Memory_内存管理原理

每天进步0.1的专栏

08-12

2041

iOS内存管理方式分为:mrc(手动内存)：arc(自动内存) 主要说说mrc手动内存,因为你只有搞懂了它的原理,你才能用好自动管理,要不用了半天自动管理,连内存怎么工作的都不知道,岂不是很尴尬的一件事? 1、OC内存管理的原理 1、OC内存管理管的是引用计数(就是当前对象被引用的数量)① 2、当引用计数大于0的时候，一个对象是可以用的 3、当引用计数减到

Core和Kernel的区别:硬件core操作系统软件kernel

二进制模----细微行动改变影响世界

04-15

2919

Core和Kernel的区别:硬件core操作系统软件kernel

CPU个数、内核数、线程数的区别

最新发布

06-01

这里提供一个使用CUDA编写的矩阵乘法示例，利用GPU加速CPU运算： ```c++ #include <stdio.h> #include <cuda_runtime.h> #define N 1024 #define BLOCK_SIZE 16 __global__ void matrixMul(float *a, float *b, float *c, int n) { int row = blockIdx.y * blockDim.y + threadIdx.y; int col = blockIdx.x * blockDim.x + threadIdx.x; if (row < n && col < n) { float sum = 0; for (int i = 0; i < n; i++) { sum += a[row * n + i] * b[i * n + col]; } c[row * n + col] = sum; } } int main() { float *h_a, *h_b, *h_c; float *d_a, *d_b, *d_c; size_t size = N * N * sizeof(float); // Allocate memory on host and device h_a = (float *)malloc(size); h_b = (float *)malloc(size); h_c = (float *)malloc(size); cudaMalloc(&d_a, size); cudaMalloc(&d_b, size); cudaMalloc(&d_c, size); // Initialize matrices on host for (int i = 0; i < N * N; i++) { h_a[i] = 1.0f; h_b[i] = 1.0f; } // Copy matrices from host to device cudaMemcpy(d_a, h_a, size, cudaMemcpyHostToDevice); cudaMemcpy(d_b, h_b, size, cudaMemcpyHostToDevice); // Launch kernel dim3 threadsPerBlock(BLOCK_SIZE, BLOCK_SIZE); dim3 numBlocks(N / threadsPerBlock.x, N / threadsPerBlock.y); matrixMul<<<numBlocks, threadsPerBlock>>>(d_a, d_b, d_c, N); // Copy result from device to host cudaMemcpy(h_c, d_c, size, cudaMemcpyDeviceToHost); // Verify result for (int i = 0; i < N * N; i++) { if (h_c[i] != N) { printf("Error: element %d (%.1f) != %d\n", i, h_c[i], N); break; } } // Free memory free(h_a); free(h_b); free(h_c); cudaFree(d_a); cudaFree(d_b); cudaFree(d_c); return 0; } ``` 在上述示例中，我们使用CUDA编写了一个矩阵乘法的核函数`matrixMul`，并在主函数中调用该函数实现矩阵乘法。在调用`matrixMul`函数时，我们使用了CUDA提供的执行配置函数`dim3`，将矩阵划分为若干个线程块和线程，并通过调用`<<<numBlocks, threadsPerBlock>>>`来启动核函数。在核函数中，我们使用了GPU并行计算的方式，通过每个线程计算矩阵的一个元素，从而充分利用了GPU的并行计算能力。最后，我们通过调用`cudaMemcpy`将计算结果从设备内存复制回主机内存，并在主机上验证了计算结果的正确性。