linux运行大端程序,linux kernel如何处理大端小端字节序

qq_0105

于 2023-03-31 18:19:02 发布

阅读量303

点赞数

分类专栏：大小端文章标签： linux 运维服务器

原文链接：https://blog.csdn.net/weixin_28692153/article/details/116638180

版权

大小端专栏收录该内容

4 篇文章 0 订阅

订阅专栏

最近在做将kernel由小端处理器(arm)向大端处理器(ppc)的移植的工作，现在kernel进入console稳定工作，基本工作已经完成，不过移植中有很多心得还是需要总结下，今天先将kernel对于大小端字节序的处理来总结下。

之前写过大小端字节序的思考，文章链接地址：http://blog.csdn.net/skyflying2012/article/details/42065427。

根据之前的理解，字节序可以认为是处理器主观的概念，就像人如何去看待事物一样，处理器分大端和小端，对于内存的读写，只要保证数据类型一致，就不存在字节序的问题。

因此我感觉，字节序不同造成的最大差异在于对于寄存器的读写。因为外设寄存器都是小端的(根据kernel代码得出结论，下面还会在详细解释)

根据我之前字节序思考的文章，对于寄存器读写差异，有2种方案：

(1)从硬件上解决这个问题，对于32位cpu，将32根数据总线反接，但是这样对于寻址小于32位数据可能有问题，并且不能所有模块都反接(如内存)，这还涉及到编译器的问题。

(2)从软件上解决这个问题，在底层读写寄存器函数中，将读/写的数据进行swap。

作为软件人员，我最关心第二种方案是否可行，因为在读写寄存器时对数据进行swap，增加了寄存器读写的复杂度，原来一条存储/加载指令可以完成的工作，现在可能需要增加一些更swap相关的指令，无法保证寄存器操作的原子性了。对于高性能，大并发的系统，可能造成竞态。

因此用最少的指令完成数据swap和r/w寄存器，才能保证linux系统正常稳定运行。

在移植bootloader中我是将数据进行位移来完成swap，因bootloader单进程，不会存在竞态问题。

在kernel移植时很担心这个问题，但是发现kernel下已经提供了大小端处理器操作寄存器时的通用函数，就是readl/writel(以操作32位寄存器为例)。

对于driver的开发者不需要关心处理器的字节序，寄存器操作直接使用readl/writel即可。

网上有很多文章提到readl/writel，但是没有具体分析其实现。

今天就主要来分析下readl/writel如何实现高效的数据swap和寄存器读写。我们就以readl为例，针对big-endian处理器，如何来对寄存器数据进行处理。

kernel下readl定义如下，在include/asm-generic/io.h

#define readl(addr) __le32_to_cpu(__raw_readl(addr))

__raw_readl是最底层的寄存器读写函数，很简单，就从直接获取寄存器数据。来看__le32_to_cpu的实现，该函数针对字节序有不同的实现，对于小端处理器，在./include/linux/byteorder/little_endian.h中，如下：

#define __le32_to_cpu(x) ((__force __u32)(__le32)(x))

相当于什么都没做。而对于大端处理器，在./include/linux/byteorder/big_endian.h中，如下：

#define __le32_to_cpu(x) __swab32((__force __u32)(__le32)(x))

看字面意思也可以看出，__swab32实现数据翻转。等下我们就来分析__swab32的实现，精髓就在这个函数。

但是这之前先考虑一个问题，对于不同CPU，如arm mips ppc，怎么来选择使用little_endian.h还是big_endian.h的呢。

答案是，针对不同处理器平台，有arch/xxx/include/asm/byteorder.h头文件，来看下arm mips ppc的byteorder.h分别是什么。

arch/arm/include/asm/byteorder.h

* arch/arm/include/asm/byteorder.h

*

* ARM Endian-ness. In little endian mode, the data bus is connected such

* that byte accesses appear as:

* 0 = d0...d7, 1 = d8...d15, 2 = d16...d23, 3 = d24...d31

* and word accesses (data or instruction) appear as:

* d0...d31

*

* When in big endian mode, byte accesses appear as:

* 0 = d24...d31, 1 = d16...d23, 2 = d8...d15, 3 = d0...d7

* and word accesses (data or instruction) appear as:

* d0...d31

*/

#ifndef __ASM_ARM_BYTEORDER_H

#define __ASM_ARM_BYTEORDER_H

#ifdef __ARMEB__

#include

#else

#include

#endif

#endif

arch/mips/include/asm/byteorder.h

/*

* This file is subject to the terms and conditions of the GNU General Public

* License. See the file "COPYING" in the main directory of this archive

* for more details.

*

* Copyright (C) 1996, 99, 2003 by Ralf Baechle

*/

#ifndef _ASM_BYTEORDER_H

#define _ASM_BYTEORDER_H

#if defined(__MIPSEB__)

#include

#elif defined(__MIPSEL__)

#include

#else

# error "MIPS, but neither __MIPSEB__, nor __MIPSEL__???"

#endif

#endif /* _ASM_BYTEORDER_H */

arch/powerpc/include/asm/byteorder.h

#ifndef _ASM_POWERPC_BYTEORDER_H

#define _ASM_POWERPC_BYTEORDER_H

/*

* This program is free software; you can redistribute it and/or

* modify it under the terms of the GNU General Public License

* as published by the Free Software Foundation; either version

* 2 of the License, or (at your option) any later version.

*/

#include

#endif /* _ASM_POWERPC_BYTEORDER_H */

可以看出arm mips在kernel下大小端都支持，arm mips也的确是可以选择处理器字节序。ppc仅支持big-endian。(其实ppc也是支持选择字节序的)

各个处理器平台的byteorder.h将littlie_endian.h/big_endian.h又包了一层，我们在编写driver时不需要关心处理器的字节序，只需要包含byteorder.h即可。

接下来看下最关键的__swab32函数，如下：

在include/linux/swab.h中

/**

* __swab32 - return a byteswapped 32-bit value

* @x: value to byteswap

*/

#define __swab32(x) \

(__builtin_constant_p((__u32)(x)) ? \

___constant_swab32(x) : \

__fswab32(x))

宏定义展开，是一个条件判断符。

__builtin_constant_p是一个gcc的内建函数，用于判断一个值在编译时是否是常数，如果参数是常数，函数返回 1，否则返回 0。

如果数据是常数，则__constant_swab32，实现如下：

#define ___constant_swab32(x) ((__u32)( \

(((__u32)(x) & (__u32)0x000000ffUL) << 24) | \

(((__u32)(x) & (__u32)0x0000ff00UL) << 8) | \

(((__u32)(x) & (__u32)0x00ff0000UL) >> 8) | \

(((__u32)(x) & (__u32)0xff000000UL) >> 24)))

对于常数数据，采用的是普通的位移然后拼接的方法，对于常数，这样的消耗是有必要的(这是kernel的解释，不是很理解)

如果数据是运行时计算数据，则使用__fswab32，实现如下：

static inline __attribute_const__ __u32 __fswab32(__u32 val)

{

#ifdef __arch_swab32

return __arch_swab32(val);

#else

return ___constant_swab32(val);

#endif

}

如果未定义__arch_swab32，则还是采用__constant_swab32方法翻转数据，但是arm mips ppc都定义了各自平台的__arch_swab32，来实现一个针对自己平台的高效的swap，分别定义如下：

arch/arm/include/asm/swab.h

static inline __attribute_const__ __u32 __arch_swab32(__u32 x)

{

__asm__ ("rev %0, %1" : "=r" (x) : "r" (x));

return x;

}

arch/mips/include/asm/swab.h

static inline __attribute_const__ __u32 __arch_swab32(__u32 x)

{

__asm__(

" wsbh %0, %1 \n"

" rotr %0, %0, 16 \n"

: "=r" (x)

: "r" (x));

return x;

}

arch/powerpc/include/asm/swab.h

static inline __attribute_const__ __u32 __arch_swab32(__u32 value)

{

__u32 result;

__asm__("rlwimi %0,%1,24,16,23\n\t"

"rlwimi %0,%1,8,8,15\n\t"

"rlwimi %0,%1,24,0,7"

: "=r" (result)

: "r" (value), "0" (value >> 24));

return result;

}

可以看出，arm使用1条指令(rev数据翻转指令)，mips使用2条指令(wsbh rotr数据交换指令)，ppc使用3条指令(rlwimi数据位移指令)，来完成了32 bit数据的翻转。这相对于普通的位移拼接的方法要高效的多！

其实从函数名__fswab也可以看出是要实现fast swap的。

我们反过来思考下，kernel针对小端处理器的寄存器读写数据没有做任何处理，而对于大端处理器却做了swap，这也说明了外设寄存器数据排布是小端字节序的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
linux运行大端程序,linux kernel如何处理大端小端字节序

作为软件人员，我最关心第二种方案是否可行，因为在读写寄存器时对数据进行swap，增加了寄存器读写的复杂度，原来一条存储/加载指令可以完成的工作，现在可能需要增加一些更swap相关的指令，无法保证寄存器操作的原子性了。根据之前的理解，字节序可以认为是处理器主观的概念，就像人如何去看待事物一样，处理器分大端和小端，对于内存的读写，只要保证数据类型一致，就不存在字节序的问题。对于常数数据，采用的是普通的位移然后拼接的方法，对于常数，这样的消耗是有必要的(这是kernel的解释，不是很理解)
复制链接

扫一扫

专栏目录

qq_0105 CSDN认证博客专家 CSDN认证企业博客

码龄10年

35: 原创

4万+: 周排名

4万+: 总排名

16万+: 访问

: 等级

1276: 积分

407: 粉丝

131: 获赞

16: 评论

857: 收藏

私信

关注

热门文章

分类专栏

DPDK 5篇
平台设备驱动 4篇
Linux Clock 1篇
Linux PHY 15篇
Linux PinCtrl 1篇
大小端 4篇
Openwrt 10篇
Linux 22篇
Linux网络子系统 18篇
隧道技术 9篇
hostap 4篇
Netfilter 2篇
script 5篇
虚拟网络设备 5篇
OpenVswitch 9篇
网络基础 2篇
以太网 2篇
python 1篇

最新评论

扫盲-以太网MII接口类型大全-MII、RMII、SMII、GMII、RGMII、SGMII、XGMII、XAUI、RXAUI
lvshuai666: 能介绍一下RSGMII和QSGMII吗？
gcc -Wall详解
meiyuan0369: vscode里面能设置每次编译都加上-wall吗？或者让vscode本身自动显示这类警告信息
NAPI(New API)的一些浅见
weixin_43827612: napi_complete --driver告诉内核其工作不饱满即中断不多，数据量不大，改变napi的状态机，后续将采用纯中断方式响应数据。---这里有些疑问：我的理解只是这一次的napi结束了，下次还是会进入napi的流程并不会切换到poll
【STM32】以太网DMA描述符
qq_42009737: 所以如果做一个ethernet dma操作 1.首先需要手动定义结构体-用以描述4个32bit描述符的相关信息定义之后需要具体赋值结构体的内容 2.然后把例化的结构体的基地址写入寄存器把描述符的长度写入相应寄存器 3.开辟一段内存初始并赋值这段内存将内存的起始地址和长度写入结构体
gcc -Wall详解
清澈的海水: 本来想换用clang，不过知道了gcc -wall

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。