Zynq设备树详解：理解Linux内核与硬件交互-CSDN博客

本文链接：https://blog.csdn.net/klaus_wei/article/details/42915545

zynq设备树历史最详解

注：由于内核版本的演变，设备树成了任何使用较高版本linux系统的设备平台所必须文件，然国内相关技术文档严重不足，本文是国外技术专栏的翻译，原文链接：http://xillybus.com/tutorials/device-tree-zynq-1

本教程是针对Xilinx'Zynq-7000设备写的，但其中的概念适用于所有使用了设备树的Linux内核。本文使用Xillinux发行版为例，该发行版运行于Zedboard硬件上。

设备树有什么好处
设想一下：bootloader刚刚将Linux内核复制到内存中，然后跳到内核的入口点开始执行。此时内核就像运行在处理器上的一个裸机程序。需要配置处理器，设置虚拟内存，向控制台打印一些信息。但是这些事情如何完成？所有的这些操作都要通过写寄存器来实现，但Linux内核如何知道这些寄存器的地址？如何知道当前有多少个CPU核可以使用？有多少内存可以访问？

最直接的办法就是在内核代码里为指定平台写好这些代码，由内核配置参数决定哪些平台代码将被启用。当一切都固定不变时这种方法还不错，比如在x86处理器上内部的寄存器，或是BIOS的访问。但对于变化量来说，比如PCI/PCIe外设，就需要内核明确了解这些变化的细节。

ARM架构已经变成了Linux社区的一个在麻烦：即使处理器使用相同的编译器和函数，但具体到某一种芯片，它就有自己的寄存器地址和不同的配置方式。不仅如此，每种板子都有自己的外设。结果造成内核中有大量的头文件、补丁和特殊的配置参数，它们的一种组合就对应于一款芯片的一种特殊板型。总之，这造成了大量丑陋和不可维护的代码。

另外，每个编译出来的内核bin文件都是为某一款芯片的某一种板子，有点像为市场上某一款PC主板编译内核。所以很希望为所有ARM处理器编译内核时，让内核能以某种方式识别硬件，然后使用正确的驱动，就像一台PC一样。

怎么实现呢？在PC上，寄存器初始化是硬编码的，其他的信息由BIOS提供。所以当有另一块软件提供这些信息时，硬件自动检测也很容易。ARM处理器没有BIOS，Linux内核只能靠自己了。

解决方案是设备树devicetree, 也称作Open Firmware(OF)或FlattenedDevice Tree(FDT)。本质上是一个字节码格式的数据结构，其中包含信息在内核启动时非常有用。bootloader在跳到内核入口点之前将这一块数据复制到RAM中的已知地址。

设备树的严格的规范，却没有规定哪些内容可以放置其中以及放置的位置。内核可以搜索设备树中的任意路径和参数。程序员来决定哪些配置作为参数放进设备树里，以及放置在什么地方。

采取标准的树结构，则可用一套方便的API来操作。例如，约定好如何定义总线上的外设，那么API可以获取到驱动所需的基本信息：地址、中断和自定义变量。后面会介绍更多。

对于我们大多数人来说，我们用设备树来向内核描述对硬件的添加或删除操作，作为响应，内核就可以加载或卸载相应的驱动。硬件的特殊信息也可以通过设备树来向内核传达。

编译设备树
设备树有三种形式：
* 文本文件 (.dts) - 源
二进制对象 (.dtb) - 目标码
Linux系统中/proc/device-tree目录 - 调试和逆向信息

启用/proc/device-tree目录需要打开配置CONFIG_PROC_DEVICETREE:
Device Drivers --->
Device Tree and Open Firmware support --->
[*] Support for device tree in /proc

对于设备树，我们一般的使用流程是：编辑DTS文件，然后用一个工具将其编译成DTB文件，这个工具就在Linux内核源码scripts/dtc/目录下。

设备树编译器也可以单独下载并编译：
$ git clone git://www.jdl.com/software/dtc.git dtc
$ cd dtc
$ make

但是下文的描述都使用内核原码中的dtc工具。

设备树的语法在这里描述。注意这种语言并不作任何执行操作，不像XML，这只是一种组织数据的语法。一些架构有自动产生设备树的工具，来自于XPS项目。但目前对于Zynq EPP平台还没有此工具。

DTS编译为DTB：
$ scripts/dtc/dtc -I dts -O dtb -o /path/to/my-tree.dtb /path/to/my-tree.dts

这样就创建了my-tree.dtb二进制文件。dtc是主机上的一个程序。如果内核没有编译过，则先需要编译好DTS编译器：配置内核，也可以复制一份已有的配置文件到内核根目录下的.config。如下：
$ make ARCH=arm digilent_zed_defconfig

生成DTS编译器：
$ make ARCH=arm scripts

dtc也可以从一个DTB文件或/proc/device-tree文件系统反编译。例如从DTB反编译：
$ scripts/dtc/dtc -I dtb -O dts -o /path/to/fromdtb.dts/path/to/booted_with_this.dtb

生成的dts文件仍然可以被用来生成dtb。但最好还是使用最初的DTS文件，因为一些参考标签在反编译的DTS文件中显示为数字。

从运行中的内核生成DTS文件：
# scripts/dtc/dtc -I fs -O dts -o ~/effective.dts /proc/device-tree/

设备树结构

Zynq的设备树如下：
/dts-v1/;
/ {
#address-cells = <1>;
#size-cells = <1>;
compatible = "xlnx,zynq-zed";
interrupt-parent = <&gic>;
model = "Xillinux for Zedboard";
aliases {
serial0 = &ps7_uart_1;
} ;
chosen {
bootargs = "consoleblank=0 root=/dev/mmcblk0p2 rw rootwaitearlyprintk";
linux,stdout-path = "/axi@0/uart@E0001000";
};

cpus {

[ ... CPU definitions ... ]

} ;
ps7_ddr_0: memory@0 {
device_type = "memory";
reg = < 0x0 0x20000000 >;
} ;
ps7_axi_interconnect_0: axi@0 {
#address-cells = <1>;
#size-cells = <1>;
compatible = "xlnx,ps7-axi-interconnect-1.00.a","simple-bus";
ranges ;

[ ... Peripheral definitions... ]

} ;
} ;

这是Xillinux使用的设备树，删去了两个部分：一个描述CPUs(比较无趣)，另一个定义外设(太长了，后面再深入其中的信息)。

默认使用的dts是/boot/devicetree-3.3.0-xillinux-1.0.dts。

在第一行版本描述之后，设备树以一个斜杠/开始，表示这是树的根，然后是大括号。从DTS编译器的角度来看，大括号包含大更深的层级(相当于文件系统里的目录结构)。内核代码会遍历这颗树，在某个路径上抓取到想要的信息(就像在文件系统的某个路径上读文件)。

树的结构是以内核期望为准。其中的赋值对dtc来说没有意义。事实上，树中的许多赋值语句都会被内核忽略掉，就像某个文件存在于文件系统中，但没有程序去打开它。

从用户空间访问数据
与文件系统作类比并不是想当然，内核真的实现了这个文件系统/proc/device-tree：每个大括号表示一个目录，目录名是大括号前面的字符串。

或直接：
# cat '/proc/device-tree/axi@0/compatible'
xlnx,ps7-axi-interconnect-1.00.asimple-bus

:
ps7_axi_interconnect_0:

冒号之前的是标签，只出现在DTS文件中，而不会出现在DTB文件里。而靠近大括号的字符串为目录名。

如上示范，赋值操作在/proc里表示为一个文件，文件名为等号左边的字符串，文件内容为等号右边的字符串。如果只没有等号，则创建一个空文件。

上例显示，设备树即能方便地向用户空间程序传递信息，也能向内核传递信息， /proc/device-tree虚拟文件系统让这些信息变得可访问。毋须多言，内核中有一套API可访问设备树结构和数据。

你可能注意到了整型以大端形式表示，Zynq处理器是小端的，留意这点。

设备树里的启动参数
一般有三个地方可以放置内核启动命令：
. 内核配置的CONFIG_CMDLINE参数
. 由bootloader传递给内核
. 在设备树的chosen/bootargs下描述

使用哪一个取决于内核的配置。在Xillinux中，使用设备树chosen/bootargs里描述的cmdline。

选择哪个UART来输出内核启动信息是在初始代码里写死的。这里即使删掉ps7_uart_1: serial@e0001000这一行，启动信息仍会从UART中输出，只是不会再出现/dev/ttyPS0设备节点了。

"alias"和"linux,stdout-path"赋值语句是这个架构历史遗留的，在这里没有意义。

定义外设
可能你读本文是为了给你的设备写一个Linux驱动，在这方面要推荐著名的《Linux Device Driver》。但是在写一个设备驱动之前，允许我分享写Linux驱动的第一诫：永远不要为Linux写设备驱动。

更好的办法是找一个维护状态良好的类似功能的设备驱动，然后修改它。这不仅仅意味着更容易，更可能帮我们避免我们一些未意识到的问题。从其他驱动移植过来可以让这份驱动更容易被理解，可移植，更可能被内核树接受。

所以现在的重点变为理解其他驱动，然后做一点调整。有疑问的地方就照着别人的做法做。创新和个人风格在这里没什么用。

现在，回到设备树。让我们来看看第二部分省略的内容：
ps7_axi_interconnect_0: axi@0 {
#address-cells = <1>;
#size-cells = <1>;
compatible = "xlnx,ps7-axi-interconnect-1.00.a","simple-bus";
ranges ;
gic: interrupt-controller@f8f01000 {
#interrupt-cells = < 3 >;
compatible = "arm,cortex-a9-gic";
interrupt-controller ;
reg = < 0xf8f01000 0x1000 >,< 0xf8f00100 0x100 >;
} ;
pl310: pl310-controller@f8f02000 {
arm,data-latency = < 3 2 2 >;
arm,tag-latency = < 2 2 2 >;
cache-level = < 2 >;
cache-unified ;
compatible = "arm,pl310-cache";
interrupts = < 0 34 4 >;
reg = < 0xf8f02000 0x1000 >;
} ;

[ ... more items ... ]

xillybus_0:xillybus@50000000 {
compatible = "xlnx,xillybus-1.00.a";
reg = < 0x50000000 0x1000 >;
interrupts = < 0 59 1 >;
interrupt-parent = <&gic>;
xlnx,max-burst-len = <0x10>;
xlnx,native-data-width = <0x20>;
xlnx,slv-awidth = <0x20>;
xlnx,slv-dwidth = <0x20>;
xlnx,use-wstrb = <0x1>;
} ;
} ;

这里只列出原始DTS文件中的两个设备。

第一个条目：Zynq处理器的中断控制器。这个条目确保中断控制器被加载。注意它的标签是“gic"。这个标签被每个使用中断的设备引用。

终于可以讲述最有趣的部分了：以上说的这些如何与内核代码配合工作。

关于内核驱动
设备驱动加载和卸载时有四件事情会发生：
. 硬件存在时(比如在设备树中声明)，内核代码加载相应驱动
. 驱动需要了解设备的物理地址
. 驱动需要了解设备触发的中断号，用来注册中断处理函数。
. 一些特殊信息需要被获取

内核中有直接访问设备树的API，但是设备驱动使用专用接口更方便，这些专用接口受PCI/PCIe驱动的API影响。来看下xillybus_0条目，这是一个挂载于AXI总线上的典型逻辑设备。

标签和节点名
首先，标签("xillybus")和条目名()。标签可以省略，条目节点名的格式为()，最后在/sys下产生一个标准的条目(/sys/devices/axi.0/50000000.xillybus/)。，不过内核肯定不是从这里访问设备树的。

驱动自动加载
节点中的第一个赋值语句compatible = “xlnx,xillybus-1.00.a”是最重要的一句：它连接硬件和驱动。当内核在总线上扫描设备时(设备节点在设备树里挂在一个总线节点下)，内核检索"compatible"字段，然后将其字符串与一些已知的字符串比较。这个过程会在启动时自动发生两次：
. 内核启动时，编译进内核的驱动与设备树中某个"compatible"条目匹配
. 之后加载内核模块时，再触发一次匹配操作

内核驱动和"compatible"条目的连接由驱动代码中的一小段完成：
static struct of_device_id xillybus_of_match[] __devinitdata = {
{ .compatible = "xlnx,xillybus-1.00.a", },
{}
};

MODULE_DEVICE_TABLE(of,xillybus_of_match);

这段代码使得驱动与某一个"compatible"条目匹配。注意上面的id表中有一个空结构，用这个空意绪标志id表的结束。

在上段代码之后，一定有类似如下的一段代码：
static struct platform_driver xillybus_platform_driver = {
.probe = xilly_drv_probe,
.remove = xilly_drv_remove,
.driver = {
.name = "xillybus",
.owner = THIS_MODULE,
.of_match_table = xillybus_of_match,
},
};

platform_driver_register(&xillybus_platform_driver)在模块初始化里被调用。这个结构告诉内核，当驱动与某个硬件匹配时，xilly_drv_probe 被调用。

对内核来说，"compatible"字串需要与某个驱动名相同。”xlnx"前缀用于防止名字冲突。

另外，一个设备可以有多个"compatible"。因为一个设备可以有多个模块对应多个驱动。

可能会需要匹配硬件的名字和类型，但这不常用。

写内核模块时需要特别注意，自动加载机制依赖于/lib/modules/{kernel version}/modules.ofmap文件中的"compatible"字串，其他定义文件也在这个目录下。正确的方式是把*.ko文件复制到/lib/modules/{kernelversion}/kernel/drivers/下的相关目录中，然后：
depmod -a

获取资源信息

内核模块驱动加载之后，就开始把硬件资源管理起来，如读写寄存器、接收中断。

来看看设备树里的一条：
xillybus_0: xillybus@50000000 {
compatible = "xlnx,xillybus-1.00.a";
reg = < 0x50000000 0x1000 >;
interrupts = < 0 59 1 >;
interrupt-parent = <&gic>;

xlnx,max-burst-len =<0x10>;
xlnx,native-data-width = <0x20>;
xlnx,slv-awidth = <0x20>;
xlnx,slv-dwidth = <0x20>;
xlnx,use-wstrb = <0x1>;
} ;

驱动一般在探测函数里就取得了硬件内存段的所有权(探测函数就是probe指针指向的函数)。

来看看一个典型探测函数的框架：
static int __devinit xilly_drv_probe(struct platform_device *op)
{
const struct of_device_id *match;

match =of_match_device(xillybus_of_match, &op->dev);

if (!match)
return -EINVAL;

第一个操作就是检查probe是否作用在相关硬件上。

访问寄存器

下一步，分配一段内存并映射到虚拟内存中。
int rc = 0;
struct resource res;
void *registers;

rc = of_address_to_resource(&op->dev.of_node,0, &res);
if (rc) {
/* Fail */
}

if(!request_mem_region(res.start, resource_size(&res), "xillybus")){
/* Fail */
}

registers =of_iomap(op->dev.of_node, 0);

if (!registers) {
/* Fail */
}

of_address_to_resource() 在设备树中找到第一个"reg"，并将解析到的信息填充在"res"结构体里。这个例子里"reg = <0x50000000 0x1000 >”, 指的是分配一块起始物理地址是0x50000000，长度为0x1000字节的空间。of_address_to_resource()会设置res.start =0x50000000， res.end = 0x50000fff。

调用request_mem_region()是为了注册特殊的内存段。目的是避免两个驱动访问同一段寄存器空间而造成的冲突。resource_size()是个内联函数，返回segment的大小(此处是0x1000)。

of_iomap()函数是of_address_to_resource()和ioremap()的组合，本质上等效于ioremap(re.start, resource_size(&res)).确保物理段已经映射到虚拟内存中，函数返回内存段的虚拟地址空间起始地址。

显然，当模块卸载或某个错误发生时，这些操作都需要有恢复动作。

访问硬件寄存器请使用iowrite32(),ioread32()以及其他的函数和宏，而不要直接使用上面的"register"指针。

中断处理

这部分的驱动很简单，类似如下：
irq = irq_of_parse_and_map(op->dev.of_node, 0);

rc = request_irq(irq,xillybus_isr, 0, "xillybus", op->dev);

irq_of_parse_and_map()在设备树里查找中断的描述项，然后返回中断号，request_irq()将使用这个中断号来注册。第二个参数是0,表示使用设备树中的第一个中断。

设备树里面描述是：
interrupts = < 0 59 1 >;
interrupt-parent = <&gic>;

那么使用了这三个数据中的哪一个呢？

第一个0是一个标志，用于指示中断是否是SPI(共享中断，shared peripheral interrupt)。非0值表示它是SPI。事实上在Zynq硬件上，这些中断都是共享的，这里是为了方便才写0, 软件上认为它不共享。

第二个数据表示中断号。

第三个数字是中断类型，可以有如下值：

0 - 内核不改变它，开机或uboot设置它是什么样就什么样。
1 - 上升沿触发
4 - 电平触发，高电平表示来中断。
不允许有其他值，下降沿触发和低电平中断目前不支持，因为硬件不支持那些模式。如果需要这样的触发方式，就得在硬件上加一个非门。

值得注意的是第三个数字在设备树里通常都是0, 所以Linux内核不去改变中断模式。这通常意味着高电平触发。这也让驱动依赖于bootloader里的设置。

interrupt-parent 这一句，必须指向中断控制器&gic。如果反编译一个DTB文件，这里的&gic会被一个数字代替，通常是0x1。

Application-specific data
之前提过，设备树中是一些特殊信息，这样一个驱动可以管理数片类似的硬件。例如，一个LCD显示驱动，分辨率信息和物理尺寸可能出现在设备树中。串口信息要告诉驱动当前的时钟频率。

最简单的，最常用的形式，这个信息由一条赋值语句组成：
xlnx,slv-awidth = <0x20>;

"xlnx"前缀可以防止命名冲突。名字可以任意取，但最好能望文知意。这里的"xlnx"是使用软件自动生成设备树时加上的前缀。

为了抓取到这一条信息，代码可以这样写：\
void *ptr;
ptr = of_get_property(op->dev.of_node, "xlnx,slv-awidth", NULL);

if (!ptr) {
/* Couldn't find the entry */
}

第三个参数NULL，是一个长度指针，可以返回数据的长度。

这条语句的值是一个数字：
int value;
value = be32_to_cpup(ptr);

be32_to_cpup读“ptr”指向的数据，从大端转到处理器的小端，然后就得到想要的数字了。

drivers/of/base.c中有大量读取这些信息的API。

总结
为一个外置写一个设备树entry很简单：
. 为"compatible"赋一个字符串"magicstring"，自动生成工具的生成格式一般是：名字+版本。
. 在数据手册里查看总线上设备的地址分配信息，写一条 "reg=" 语句。
. "interrupt-parent=<&gic>"
. 中断号 "interrupt="
. 最后加上一些设备的自定义参数