Linux netlink之添加一个简单协议

一、netlink简介

netlink协议是一种基于socket的IPC机制,可用于内核与用户空间进程、用户空间进程与用户空间进程通信,如图所示:


netlink协议基于BSD socket和AF_NETLINK地址簇(address family),使用32位的端口号寻址(以前称作PID),每个netlink协议(或称作总线,man手册中则称之为netlink family),通常与一个或一组内核服务/组件相关联,如NETLINK_ROUTE用于获取和设置路由与链路信息、NETLINK_KOBJECT_UEVENT用于内核向用户空间的udev进程发送通知等。netlink具有以下特点:
① 支持全双工、异步通信(当然同步也支持)
② 用户空间可使用标准的BSD socket接口(但netlink并没有屏蔽掉协议包的构造与解析过程,推荐使用libnl等第三方库)
③ 在内核空间使用专用的内核API接口
③ 支持多播(因此支持“总线”式通信,可实现消息订阅)
④ 在内核端可用于进程上下文与中断上下文

二、为AF_NETLINK地址簇添加新协议的方法

关于这个要添加的netlink”协议“的说法,网上有多种不一致的术语,有人称之为”netlink family“,有人称之为”bus“,还有人称之为“netlink protocol”,实际上指的是同一个东西,本文将称之为(netlink)协议。要在内核中使用netlink,需要为自己的内核服务添加新的netlink,现在有两种方法:
① 最开始的方法,使用<net/netlink.h>中的接口,即直接基于nlmsghdr。这是在Linux加入netlink机制之初添加协议的方法。该方法有个限制就是协议的数量不能超过32个,Linux3.10内核已经使用了22个。
② 使用netlink generic。netlink generic是基于第一种方法实现的,协议号为NETLINK_GENERIC。它在NETLINK_GENERIC协议之上提供了多路复用,在其之上添加的新协议称之为Generic Netlink 协议,在没有歧义的情况下,也称作Generic协议或netlink协议。

出于学习的目的,本文将使用第一种方法。

三、NetLink协议基础

netlink机制提供的协议头如图所示:


netlink协议是面向消息的,要定义自己的协议,需要基于netlink提供的协议头,即struct nlmsghdr。自定义协议按照协议头格式填充协议头内容,并定义自己的playload,通常自定义的协议体包含自定义协议头与额外的属性,netlink提供了一系列的标准方法用于对消息进行打包与拆包。struct nlmsghdr的定义如下

struct nlmsghdr {
        __u32           nlmsg_len;      /* Length of message including header */
        __u16           nlmsg_type;     /* Message content */
        __u16           nlmsg_flags;    /* Additional flags */
        __u32           nlmsg_seq;      /* Sequence number */
        __u32           nlmsg_pid;      /* Sending process port ID */
};
其中一些字段,如消息标志与消息类型字段,netlink对其作了一些预定义的值。除了这些预定义的值外,新协议可以定义自己的值。各字段含义如下:

① Total Length (32bit) 协议头与payload的总长度(包含中间对齐和payload尾部对齐的空间)
② Message Type (16bit)。除了预定义的几个类型外,新协议可以自由的加入自己的消息类型。类型对netlink核心透明
③ Message Flags (16bit)。用于描述协议的行为,对netlink核心不透明
④ Sequence Number (32bit)。可选,用于标志已发送的消息,如错误消息可以引用一个已发送消息。
⑤ Port Number (32bit)。目的端口。若未指定,则会发送给内核

四、添加协议NETLINK_TEST

1. 协议格式设计:

为简便起见,仅设计一个具有echo功能的协议。不在标准nlmsghdr之后的payload中定义自己的协议头,payload即为echo文本串,不使用netlink提供的消息标志。定义两种消息类型:NLMSG_GETECHO(用于echo请求包)和NLMSG_SETECHO(用于echo响应包。
出于学习的目的,用户进程使用socket接口收发信息。在实际的开发过程中,推荐是同libnl等库,该库提供的接口类似于内核中的那套接口,用起来非常方便。

2. 用户空间程序:

#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <linux/netlink.h>
#include <sys/socket.h>
#include <strings.h>
#include <string.h>
#define NETLINK_TEST 31 // 自定义的协议号
/** 消息类型 **/
#define NLMSG_SETECHO 0x11
#define NLMSG_GETECHO 0x12
/** 最大协议负荷(固定) **/
#define MAX_PAYLOAD 101

struct sockaddr_nl src_addr, dst_addr;
struct iovec iov;
int sockfd;
struct nlmsghdr *nlh = NULL;
struct msghdr msg;

int main( int argc, char **argv)
{
    if (argc != 2) {
        printf("usage: ./a.out <str>\n");
        exit(-1);
    }

    sockfd = socket(PF_NETLINK, SOCK_DGRAM, NETLINK_TEST); // 创建NETLINK_TEST协议的socket
    /* 设置本地端点并绑定,用于侦听 */
    bzero(&src_addr, sizeof(src_addr));
    src_addr.nl_family = AF_NETLINK;
    src_addr.nl_pid = getpid();
    src_addr.nl_groups = 0; //未加入多播组
    bind(sockfd, (struct sockaddr*)&src_addr, sizeof(src_addr));
    /* 构造目的端点,用于发送 */
    bzero(&dst_addr, sizeof(dst_addr));
    dst_addr.nl_family = AF_NETLINK;
    dst_addr.nl_pid = 0; // 表示内核
    dst_addr.nl_groups = 0; //未指定接收多播组 
    /* 构造发送消息 */
    nlh = malloc(NLMSG_SPACE(MAX_PAYLOAD));
    nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD); //保证对齐
    nlh->nlmsg_pid = getpid();  /* self pid */
    nlh->nlmsg_flags = 0;
    nlh->nlmsg_type = NLMSG_GETECHO;
    strcpy(NLMSG_DATA(nlh), argv[1]);
    iov.iov_base = (void *)nlh;
    iov.iov_len = nlh->nlmsg_len;
    msg.msg_name = (void *)&dst_addr;
    msg.msg_namelen = sizeof(dst_addr);
    msg.msg_iov = &iov;
    msg.msg_iovlen = 1;

    sendmsg(sockfd, &msg, 0); // 发送
    /* 接收消息并打印 */
    memset(nlh, 0, NLMSG_SPACE(MAX_PAYLOAD));
    recvmsg(sockfd, &msg, 0);
    printf(" Received message payload: %s\n",
            NLMSG_DATA(nlh));

注意:客户进程可以不进行bind而直接recvmsg,这样,默认本地绑定的端口为当前进程ID,因此,在发送消息时应将源端口指定为getpid()

3. 内核模块:

#include <linux/module.h>
#include <linux/netlink.h>
#include <net/netlink.h>
#include <net/net_namespace.h>
#define NETLINK_TEST 31

#define NLMSG_SETECHO 0x11
#define NLMSG_GETECHO 0x12

static struct sock *sk; //内核端socket
static void nl_custom_data_ready(struct sk_buff *skb); //接收消息回调函数

int __init nl_custom_init(void)
{
    struct netlink_kernel_cfg nlcfg = {
        .input = nl_custom_data_ready,
    };
    sk = netlink_kernel_create(&init_net, NETLINK_TEST, &nlcfg);
    printk(KERN_INFO "initialed ok!\n");
    if (!sk) {
        printk(KERN_INFO "netlink create error!\n");
    }
    return 0;
}
void __exit nl_custom_exit(void)
{
    printk(KERN_INFO "existing...\n");
    netlink_kernel_release(sk);
}

static void nl_custom_data_ready(struct sk_buff *skb)
{
    struct nlmsghdr *nlh;
    void *payload;
    struct sk_buff *out_skb;
    void *out_payload;
    struct nlmsghdr *out_nlh;
    int payload_len; // with padding, but ok for echo 
    nlh = nlmsg_hdr(skb);
    switch(nlh->nlmsg_type)
    {
        case NLMSG_SETECHO:
            break;
        case NLMSG_GETECHO:
            payload = nlmsg_data(nlh);
            payload_len = nlmsg_len(nlh);
            printk(KERN_INFO "payload_len = %d\n", payload_len);
            printk(KERN_INFO "Recievid: %s, From: %d\n", (char *)payload, nlh->nlmsg_pid);
            out_skb = nlmsg_new(NLMSG_DEFAULT_SIZE, GFP_KERNEL); //分配足以存放默认大小的sk_buff
            if (!out_skb) goto failure;
            out_nlh = nlmsg_put(out_skb, 0, 0, NLMSG_SETECHO, payload_len, 0); //填充协议头数据
            if (!out_nlh) goto failure;
            out_payload = nlmsg_data(out_nlh);
            strcpy(out_payload, "[from kernel]:"); // 在响应中加入字符串,以示区别
            strcat(out_payload, payload);
            nlmsg_unicast(sk, out_skb, nlh->nlmsg_pid);
            break;
        default:
            printk(KERN_INFO "Unknow msgtype recieved!\n");
    }
    return;
failure:
    printk(KERN_INFO " failed in fun dataready!\n");
}
module_init(nl_custom_init);
module_exit(nl_custom_exit);

MODULE_LICENSE("GPL");
MODULE_DESCRIPTION("a simple example for custom netlink protocal family");
MODULE_AUTHOR("RSLjdkt");
注意:上面的回调函数是在进程上下文(系统调用中)进行的,若操作比较耗时,在实际使用中通常将工作交给内核线程处理,内核线程调用skb_recv_datagram函数。

3. 模块Makefile

obj-m += nltest.o


KID := /lib/modules/`uname -r`/build
PWD := $(shell pwd)

all:
        make -C $(KID) M=$(PWD) modules

clean:
        rm -rf *.o .cmd *.ko *.mod.c .tmp_versions

4. 操作:

insmod模块后,运行用户程序,用户进程输出:

Received message payload: [from kernel]:hello
内核模块的dmesg输出:
[181170.368671] initialed ok!
[181182.745293] payload_len = 104
[181182.749476] Recievid: hello, From: 3127

其中,From后是发送端的“地址” 

参考:

Netlink Protocol Fundamentals http://www.carisma.slowglass.com/~tgr/libnl/doc/core.html#core_netlink_fundamentals

netlink socket理解 http://www.blogjava.net/jasmine214--love/archive/2012/06/01/379752.html

generic_netlink_howto http://www.linuxfoundation.org/collaborate/workgroups/networking/generic_netlink_howto#Registering_A_Family

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Linux Netlink 是一种用于内核与用户空间进行通信的机制。它提供了一种可靠的、高效的跨进程通信方式,用于在内核和用户空间之间传递网络相关的信息和事件。 Netlink 机制通过一组专用的 socket 进行通信,允许用户空间程序发送请求到内核,以获取网络配置、状态和事件等信息,并可以控制网络设备的行为。同时,内核也可以通过 Netlink 通知用户空间应用程序有关网络相关的事件,例如连接建立、断开、路由更新等。 Netlink 消息由一个头部和一个可选的负载组成。头部包含了消息的类型、标志和序列号等信息,而负载则是具体的数据内容。不同的消息类型对应着不同的操作,例如查询配置信息、添加/删除路由、修改网络接口属性等。 Netlink 通信的优势之一是其灵活性和可扩展性。通过定义不同的消息类型,可以实现各种网络管理的功能。例如,可以使用 Netlink 来获取网络接口的状态和统计信息,监控网络连接的建立和断开,甚至控制网络设备的驱动程序。 此外,Netlink 还支持一种多播通信方式,允许多个用户空间程序同时订阅网络相关的事件。这样,当有事件发生时,内核可以将通知发送给所有订阅者,实现实时的网络状态监控和响应。 总的来说,Linux Netlink 是一种用于内核与用户空间之间进行网络相关信息传递和交互的机制。它提供了灵活、可扩展的通信方式,用于实现网络管理和监控等功能。 ### 回答2: Linux Netlink是用于在Linux内核和用户空间之间进行通信的一种机制。它可以让用户空间程序与内核进行信息交互,如获取系统状态信息、配置网络接口等。 Netlink套接字是通过调用socket()函数创建的,它允许进程使用Netlink协议与内核通信。Netlink协议有多个不同的消息类型,每个类型对应不同的功能。比如,NETLINK_ROUTE用于配置和查询路由信息,NETLINK_INET_DIAG用于获取网络连接的状态信息。 在应用程序中,可以使用套接字的send()和recv()函数发送和接收消息。消息的格式由Netlink通信协议规定,一般包括一个消息头和一个NLMSG_PAYLOAD部分,后者可以包含消息所携带的数据。 对于内核模块来说,可以使用netlink_kernel_create()函数创建一个Netlink套接字,并通过netlink_kernel_recvmsg()函数接收和处理来自用户空间的消息。 通过Netlink机制,用户空间程序可以实时监控内核的状态变化,比如网络接口的变更、路由表的变动等。同时,内核也可以通过Netlink向用户空间发送事件通知,以便及时更新相关信息。 总的来说,Linux Netlink提供了一个灵活、高效的通信机制,有效地实现了内核和用户空间之间的信息交互。它在很多情况下被广泛应用,如网络管理工具、性能监控工具等。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值