Linux性能工具-bpftrace入门

一、bpftrace简介

        bpftrace 是基于ebpf内核vm扩展出来的trace工具。

        bpftrace 是 Linux 高级追踪工具和语言。该工具基于 eBPF 和 BBC 实现了通过探针机制采集内核和程序运行的信息,然后用图表等方式将信息展示出来,帮助开发者找到隐藏较深的 Bug、安全问题和性能瓶颈。github主页介绍如下:        bpftrace 是一种基于 Linux 的eBPF高级跟踪语言,可用于最新的 Linux 内核 (4.x)。bpftrace 使用 LLVM 作为后端将脚本编译为 BPF 字节码,并利用BCC与 Linux BPF 系统进行交互,以及现有的 Linux 跟踪功能:内核动态跟踪(kprobes)、用户级动态跟踪(uprobes)、和跟踪点。bpftrace 语言的灵感来自 awk 和 C,以及 DTrace 和 SystemTap 等前身跟踪器。

        github项目地址为:GitHub - iovisor/bpftrace: High-level tracing language for Linux eBPF

二、bpftrace安装

        bfptrace官方建议linux内核版本为4.9或以上。主要是由于一些工具可能适用于旧内核,但是这些旧内核没有经过测试。

CentOS安装:

        curl https://repos.baslab.org/rhel/7/bpftools/bpftools.repo --output /etc/yum.repos.d/bpftools.repo 

        yum install bpftrace bpftrace-tools bpftrace-doc bcc-static bcc-tools

Ubuntu安装:

        1、sudo apt-get install -y bpftrace(适用于ubuntu19.04及更高版本)

        2、sudo snap install --devmode bpftrace   sudo snap connect bpftrace:system-trace(适用于ubuntu16.04及更高版本)

三、bpftrace使用入门

3.1  探针

         图中,如kprobeb/kretprobe为动态跟踪、内核级探针,kprobeb是检测函数执行的开始,kretprobe为检测结束(返回)。uprobe/uretprobe为动态跟踪、用户级探针,uprobeb是检测用户级函数执行的开始,uretprobe为检测结束(返回)。tracepoint为静态跟踪、用户级探针。

 3.2 bpftrace基础语法

        最基础的例子--以hello world开始:bpftrace -e 'BEGIN { printf("Hello, World!\n"); }'。需要注意的是有些单行命令只有结束,按ctrl+c结束了才会输出内容。

        bpftrace -l 可以列出bpftrace所支撑的探针。如bpftrace -l ‘*nanosleep’可以列出bpftrace支持的nanosleep函数相关的所有探针。

3.2.1 单行语句

        如系统函数raw_syscalls:sys_enter的调用统计,语法为:bpftrace -e 'tracepoint:raw_syscalls:sys_enter { @[comm] = count(); }'。其中count()是统计次数方法,@[]为关联数组,comm为进程名称。

其他单行函数示例如下:

# Files opened by process
bpftrace -e 'tracepoint:syscalls:sys_enter_open { printf("%s %s\n", comm, str(args->filename)); }'

# Syscall count by program
bpftrace -e 'tracepoint:raw_syscalls:sys_enter { @[comm] = count(); }'

# Read bytes by process:
bpftrace -e 'tracepoint:syscalls:sys_exit_read /args->ret/ { @[comm] = sum(args->ret); }'

# Read size distribution by process:
bpftrace -e 'tracepoint:syscalls:sys_exit_read { @[comm] = hist(args->ret); }'

# Show per-second syscall rates:
bpftrace -e 'tracepoint:raw_syscalls:sys_enter { @ = count(); } interval:s:1 { print(@); clear(@); }'

# Trace disk size by process
bpftrace -e 'tracepoint:block:block_rq_issue { printf("%d %s %d\n", pid, comm, args->bytes); }'

# Count page faults by process
bpftrace -e 'software:faults:1 { @[comm] = count(); }'

# Count LLC cache misses by process name and PID (uses PMCs):
bpftrace -e 'hardware:cache-misses:1000000 { @[comm, pid] = count(); }'

# Profile user-level stacks at 99 Hertz, for PID 189:
bpftrace -e 'profile:hz:99 /pid == 189/ { @[ustack] = count(); }'

# Files opened, for processes in the root cgroup-v2
bpftrace -e 'tracepoint:syscalls:sys_enter_openat /cgroup == cgroupid("/sys/fs/cgroup/unified/mycg")/ { printf("%s\n", str(args->filename)); }'

3.2.2 文件形式

        通过bpftrace <filename>就可以执行c style的代码,通过这类的代码,bpftrace可以实现相对复杂的逻辑。比如通过bpftrace获取当前所有shell的输入,代码如下:

BEGIN  // 初始化时执行,主要用于打印提示信息
{
        printf("Tracing bash commands... Hit Ctrl-C to end.\n");
        printf("%-9s\t%s\t%s\t%s\n", "TIME", "UID", "PID", "COMMAND");
}

uretprobe:/bin/bash:readline  //探针追踪内容
{
        time("%H:%M:%S\t");
        printf("%d\t%d\t%s\n", uid, pid, str(retval));
}

END  //bpftrace结束时执行
{
        printf("end-test");
}

官方提供了很多工具可供直接调用,地址为:https://github.com/iovisor/bpftrace/tree/master/tools

 3.2.3 自定义代码

        假设有一个C++程序如下:

#include<iostream>
using namespace std;

int add(int a, int b){
    return a+b;
}

int main(){
    int c = add(2,3);
    cout << c << endl;
}
        编译后的文件为test,现在需要知道主函数在每次调用add函数时的输入输出以及耗时。如果有源码的时候直接改源码很顺手。那如果不想改代码、重编译的话,或者在某些情况下改代码会导致软件行为出现变化,采样失真。此时用bfptrace也可以检测用户自定义代码,写一个bfptarce脚本如下,命名为mycode.bt:

uprobe:./test:add {
    printf("program begin\n");
    @start = nsecs;
}
uretprobe:./test:add {
    printf("cost: %ld ns\n", nsecs-@start);
}
END
{
    printf("program end\n");
    clear(@start);
}

执行bpftrace mycode.bt,在另一个终端上执行test,结果为:

        不用改任何代码,就知道函数执行的耗时,对于耗时情况我们也可以灵活设置策略,比如发出超时预警等策略。 

  • 1
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Tina-Linux 是一个开源的操作系统,适用于个人电脑和服务器。下面是有关 Tina-Linux 入门的一些基本信息。 首先,你需要了解 Tina-Linux 的安装过程。你可以从官方网站上下载最新的 Tina-Linux 安装镜像文件,并将其刻录成光盘或创建一个启动的 USB 驱动器。然后,你可以按照提示进行安装,设置主机名、用户名和密码等。安装完成后,你就可以进入 Tina-Linux 了。 Tina-Linux 使用类 Unix 的命令行界面(CLI)作为主要的用户界面。这意味着你需要使用一些基本的命令来操作系统,例如 ls(列出目录内容)、cd(切换目录)和mkdir(创建目录),以及一些其他必要的命令。 然而,如果你对命令行不熟悉或希望使用更友好的图形界面,Tina-Linux 也提供了图形化桌面环境(如 GNOME 或 KDE)。要切换到图形界面,你可以在命令行中输入 startx 命令,系统会启动图形化桌面。 除基本的命令行和图形界面之外,Tina-Linux 还提供了许多强大的开发工具和软件包。你可以使用包管理器来安装、更新和删除软件包。此外,你还可以从软件仓库中下载和安装各种开源软件。 在使用 Tina-Linux 的过程中,你可能会遇到一些问题。你可以在官方论坛、社区或互联网上搜索相关解决方案和技巧。Tina-Linux 社区有很多热心的用户和开发人员,他们会乐于帮助你解决问题。 在深入学习 Tina-Linux 之前,了解基本的 Linux 知识也非常重要。你可以学习如何使用 Shell 命令、文件权限和系统配置等内容,这将有助于你更好地使用 Tina-Linux。 总的来说,Tina-Linux 是一个功能强大的操作系统,提供了多种选择和定制化的功能。通过学习一些基本的命令和配置知识,你可以更好地掌握 Tina-Linux,并充分发挥其优势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值