Linux下cpu和绑核

2 篇文章 0 订阅

基本概念

cpu个数 是指物理上cpu的个数。
cpu核心数是指物理上,也就是硬件上存在着几个核心。比如,双核就是包括2个相对独立的CPU核心单元组,四核就包含4个相对独立的CPU核心单元组。
cpu线程数 是一种逻辑上的概念,简单地说,就是模拟出的CPU核心数。比如,可以通过一个物理的CPU核心模拟出2线程的CPU。一个物理的CPU核心最少对应一个线程,但通过超线程技术,一个核心可以对应两个线程,也就是说它可以同时运行两个线程。 CPU的线程数概念仅仅只针对Intel的CPU才有用,因为它是通过Intel超线程技术来实现的,最早应用在Pentium4上。如果没有超线程技术,一个CPU核心对应一个线程。对于AMD处理器而言,没有超线程的概念,线程数和核心数相同,所以在AMD的CPU参数上是没有写出线程数的。
综上,这个公式成立:
物理cpu个数 * 每个物理cpu中core的个数 * 超线程数 = 总线程数(也即逻辑CPU的个数)

举例说明

如下的例子,是在一台Linux服务器上查询的结果: 2 * 16 *2 = 64

       # 查看物理CPU个数
       $ grep 'physical id' /proc/cpuinfo | sort -u
       physical id	: 0
       physical id	: 1

       # 查看每1个物理CPU中core的个数(即核心数)
       $ grep 'core id' /proc/cpuinfo | sort -u | wc -l
       16

       # 查看总线程数(也即逻辑CPU的个数)
        grep "processor" /proc/cpuinfo |  wc -l
        64                                                                                                                                                                                                                                              	

top命令显示

top命令显示出来的cpu数量和利用率,其实是逻辑cpu的个数和使用情况。
在这里插入图片描述

代码相关

  1. 在代码里面使用while(true)循环,并且在循环里面不sleep的话,就是所谓的busy wait,会使cpu占用达到100%。
  2. 在代码里面使用while(true)+sleep的方式, sleep的时候其他线程可以抢占cpu,从而降低cpu占用率。 使用Sleep要考虑用哪种sleep: c标准库的sleep、c++标准库的std::this_thread::sleep_for、boost库的boost::this_thread::sleep_for、POSIX标准的sleep、linux系统调用的sleep等, 还要考虑interruption point的问题
  3. 但是使用while(true)+sleep的方式, 相较于其他方式,会有什么优缺点? 这个还要后续分析。其他的方式比如:callback,event,async/await,观察者模式,订阅消费模式等等。

超线程

查看是否开启超线程

在这里插入图片描述

Threads per core为1,说明没有开启超线程, Threads per core为2,说明开启了超线程。

如何开启超线程

转自 https://my.oschina.net/u/1030865/blog/3070636
以下是github上找到的动态打开、关闭超线程技术的脚本。其原理是根据/sys/devices/system/cpu/cpuX/topology/thread_siblings_list文件找到逻辑核的关系,然后编辑/sys/devices/system/cpu/cpuX/online文件实现动态开启和关闭超线程技术。

#!/bin/bash

HYPERTHREADING=1

function toggleHyperThreading() {
  for CPU in /sys/devices/system/cpu/cpu[0-9]*; do
      CPUID=`basename $CPU | cut -b4-`
      echo -en "CPU: $CPUID\t"
      [ -e $CPU/online ] && echo "1" > $CPU/online
      THREAD1=`cat $CPU/topology/thread_siblings_list | cut -f1 -d,`
      if [ $CPUID = $THREAD1 ]; then
          echo "-> enable"
          [ -e $CPU/online ] && echo "1" > $CPU/online
      else
        if [ "$HYPERTHREADING" -eq "0" ]; then echo "-> disabled"; else echo "-> enabled"; fi
          echo "$HYPERTHREADING" > $CPU/online
      fi
  done
}

function enabled() {
        echo -en "Enabling HyperThreading\n"
        HYPERTHREADING=1
        toggleHyperThreading
}

function disabled() {
        echo -en "Disabling HyperThreading\n"
        HYPERTHREADING=0
        toggleHyperThreading
}

#
ONLINE=$(cat /sys/devices/system/cpu/online)
OFFLINE=$(cat /sys/devices/system/cpu/offline)
echo "---------------------------------------------------"
echo -en "CPU's online: $ONLINE\t CPU's offline: $OFFLINE\n"
echo "---------------------------------------------------"
while true; do
    read -p "Type in e to enable or d disable hyperThreading or q to quit [e/d/q] ?" ed
    case $ed in
        [Ee]* ) enabled; break;;
        [Dd]* ) disabled;exit;;
        [Qq]* ) exit;;
        * ) echo "Please answer e for enable or d for disable hyperThreading.";;
    esac
done

备注:脚本需root权限执行;

CPU核隔离

查看系统cpu隔离情况

  • 方法一
    可以查看 /proc/cmdline里是不是有isolcpu参数,有的话说明本次重启确实带了这个参数
    在这里插入图片描述
  • 方法二
    查看进程1的cpu affinity,如果没有cpu隔离的话,这里affinity 应该是所有的核心(比如有18个逻辑cpu核心,则显示是3ffff)
    比如下图,18个cpu核心,pid1 的affinity只显示0~8, 说明9·17核心被隔离了。
    在这里插入图片描述
  • 方法三
    cat /sys/devices/system/cpu/isolated, 这个文件里面显示了所有被隔离的核心。

查看进程和线程占用的cpu

  • 查看所有进程、线程的cpu分配情况(可以用htop查看,也可以用ps -eo pid,cmd,psr查看所有进程cpu分配情况,用ps -To ‘pid,lwp,psr,cmd’ -p [PID]查看进程的所有线程的cpu分配情况)
  • 查看一个进程所有线程的cpu实时占用情况
    首先运行top -Hp [PID]命令, 显示如下:
    在这里插入图片描述
    然后按下“F”键,再用向下键走到P,按“空格键”选中,选中后行前面会带*号,然后按“ESC”键退出选择,
    在这里插入图片描述
    可以看到最后一列显示了每个线程当前运行所在的CPU核心:
    在这里插入图片描述

设置CPU绑定

  • taskset 命令
    语法格式:taskset [options] -p [mask] pid
    参数选项:
    -a, --all-tasks 操作所有的任务线程
    -p, --pid 操作已存在的pid
    -c, --cpu-list 通过列表显示方式设置CPU(逗号相隔)。 (注意: 带-c参数时使用列表方式, 不带-c参数时使用掩码方式)

  • 使用taskset绑定进程或者线程到1个cpu
    taskset命令可以把一个进程或者线程绑定到某个cpu上去,如下命令把线程65189绑定到了核心6上去。
    在这里插入图片描述
    执行后效果 如下图可以看到, 线程65189被绑定到核心6上去了。
    在这里插入图片描述

  • 使用taskset绑定进程或者线程到多个cpu
    taskset -cp 2,5-11 9865 意思就是将进程或线程9865绑定到 2,5~11核心上运行。
    这里,如果核心2,5-11做了核心隔离的话,你会发现进程的所有线程都绑定到了2上面,这不是预期的结果。https://serverfault.com/questions/573025/taskset-not-working-over-a-range-of-cores-in-isolcpus这里描述了这个问题,并给出了使用“sudo chrt -r 1 taskset -cp 2,5-11 9865”的解决方案。

This behavior seems to be an artifact of the default kernel scheduler algorithm (SCHED_OTHER for this distro/kernel). Changing the process to a different algorithm eliminates the problem, isolcpus are adequately utilized across the processes/threads.
I ended up using SCHED_RR, but I also tested SCHED_FIFO and SCHED_IDLE both of which seem to work. The process can be launched with the alternative algorithm by use of the chrt utility:
$ sudo chrt -r 1 [command]
(If you want to run as non-root you can use the setcap utility to enable CAP_SYS_NICE on the binary file related to the command)

  • 使用taskset查询一个进程的亲和情况:
    在这里插入图片描述

  • 注意:如果一个进程在代码里面,用pthread_setaffinity_np给进程的某些线程设置了绑核,使用tastset -cp [PID] 是看不出来的。 比如上面的进程在代码里面把5个线程绑定到了10/11/12/13/14 五个核,使用taskset查看结果如下:
    在这里插入图片描述

睿频

turbostat 命令, Bzy_MHz字段可以显示cpu的实际运行主频。
在这里插入图片描述

参考资料

【1】https://blog.csdn.net/tang05505622334/article/details/96477552
【2】https://serverfault.com/questions/573025/taskset-not-working-over-a-range-of-cores-in-isolcpus

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值