暑期苏嵌嵌入式Linux两周短期学习第三结

最新推荐文章于 2024-04-20 13:03:09 发布

奇点不积

最新推荐文章于 2024-04-20 13:03:09 发布

阅读量194

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_34521812/article/details/107173396

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

课后作业：

Q1：编译器三级优化分别优化了哪些？

GNU编译器提供-O选项供程序优化使用:
-O 提供基础级别的优化
-O2 提供更加高级的代码优化,会占用更长的编译时间
-O3 提供最高级的代码优化

1，编译器优化级别1

-fdefer-pop: 这种优化技术与汇编语言代码在函数完成时如何进行操作有关。

-fmerge-constans: 使用这种优化技术, 编译器试图合并相同的常量。

-fthread-jumps: 使用这种优化技术与编译器如果处理汇编代码中的条件和非条件
分支有关。

-floop-optimize: 通过优化如何生成汇编语言中的循环，编译器可以在很大程序上
提高应用程序的性能。

-fif-conversion: if-then语句应该是应用程序中仅次于循环的最消耗时间的部分。
简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支。通过减少
或者删除条件分支, 以及使用条件传送设置标志和使用运算技巧来替换他们, 编译
器可以减少if-then语句中花费的时间量。

-fif-conversion2: 这种技术结合更加高级的数学特性，减少实现if-then语句所
需的条件分支。

-fdelayed-branch: 这种技术试图根据指令周期时间重新安排指令。它还试图把
尽可能多的指令移动到条件分支前, 以便最充分的利用处理器的治理缓存。

-fguess-branch-probability: 就像其名称所暗示的, 这种技术试图确定条件分支最可
能的结果, 并且相应的移动指令, 这和延迟分支技术类似。

-fcprop-registers: 因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少
调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作。

2, 编译器优化级别2

结合了第一个级别的所有优化技术, 再加上一下一些优化：
-fforce-mem: 这种优化再任何指令使用变量前, 强制把存放再内存位置中的所有变量都复制到寄存器
中。

-foptimize-sibling-calls: 这种技术处理相关的和/或者递归的函数调用。通常, 递归的函数调用
可以被展开为一系列一般的指令，而不是使用分支。

-fstrength-reduce: 这种优化技术对循环执行优化并且删除迭代变量。迭代变量是捆绑到循环计数器
的变量, 比如使用变量, 然后使用循环计数器变量执行数学操作的for-next循环。

-fgcse：这种技术对生成的所有汇编语言代码执行全局通用表达式消除历程。这些优化操作试图分析
生成的汇编语言代码并且结合通用片段，消除冗余的代码段。

-fcse-follow-jumps: 这种特别的通用子表达式消除技术扫描跳转指令, 查找程序中通过任何其他途径都不
会到达的目标代码。这种情况最常见的例子就式if-then-else语句的else部分。

-frerun-cse-after-loop: 这种技术在对任何循环已经进行过优化之后重新运行通用子表达式消除例程。
这样确保在展开循环代码之后更进一步地优化还编代码。

-fdelete-null-pointer-checks: 这种优化技术扫描生成的汇编语言代码, 查找检查空指针的代码。编译
器假设间接引用空指针将停止程序。如果在间接引用之后检查指针，它就不可能为空。

-fextensive-optimizations: 这种技术执行从编译时的角度来说代价高昂的各种优化技术，但是它可能
对运行时的性能产生负面影响。

-fregmove: 编译器试图重新分配mov指令中使用的寄存器, 并且将其作为其他指令操作数, 以便最大化
捆绑的寄存器的数量。

-fschedule-insns: 编译器将试图重新安排指令, 以便消除等待数据的处理器。对于在进行浮点运算时有
延迟的处理器来说，这使处理器在等待浮点结果时可以加载其他指令。

-fsched-interblock: 这种技术使编译器能够跨越指令块调度指令。这可以非常灵活地移动指令以便等待
期间完成的工作最大化。

-fcaller-saves: 这个选项指示编译器对函数调用保存和恢复寄存器, 使函数能够访问寄存器值, 而且不必
保存和恢复他们。如果调用多个函数, 这样能够节省时间, 因为只进行一次寄存器的保存和恢复操作, 而
不是在每个函数调用中都进行。

-fpeephole2: 这个选项允许进行任何计算机特定的观察孔优化。

-freorder-blocks: 这种优化技术允许重新安排指令块以便改进分支操作和代码局部性。

-fstrict-aliasing: 这种技术强制实行高级语言的严格变量规则。对于c和c++程序来说, 它确保不在数据
类型之间共享变量. 例如, 整数变量不和单精度浮点变量使用相同的内存位置。

-funit-at-a-time: 这种优化技术指示编译器在运行优化例程之前读取整个汇编语言代码。这使编译器可以
重新安排不消耗大量时间的代码以便优化指令缓存。但是, 这会在编译时花费相当多的内存, 对于小型计算机可能
是一个问题。

-falign-functions: 这个选项用于使函数对准内存中特定边界的开始位置。大多数处理器按照页面读取内存，
并且确保全部函数代码位于单一内存页面内, 就不需要叫化代码所需的页面。

-fcrossjumping: 这是对跨越跳转的转换代码处理，以便组合分散在程序各处的相同代码。这样可以减少
代码的长度，但是也许不会对程序性能有直接影响。

3, 编译器优化级别3
它整合了第一和第二级别中的左右优化技巧, 还包括一下优化:
-finline-functions: 这种优化技术不为函数创建单独的汇编语言代码，而是把函数代码包含在调度程序的
代码中。对于多次被调用的函数来说, 为每次函数调用复制函数代码。虽然这样对于减少代码长度不利, 但是
通过最充分的利用指令缓存代码, 而不是在每次函数调用时进行分支操作, 可以提高性能。

-fweb: 构建用于保存变量的伪寄存器网络。伪寄存器包含数据, 就像他们是寄存器一样, 但是可以使用各种
其他优化技术进行优化, 比如cse和loop优化技术。

Q2：总结gcc静态库和动态库的制作。

1、制作静态库的方法：

（1）：现将功能函数文件编译成目标文件（.o）：gcc -c 被编译的文件名

（2）、将（1）中目标文件生成为库：ar rcs 静态库名目标文件1 目标文件2

rc：静态库不存在，就生成该库文件

s：更新库文件

（3）、使用方法（链接库）

①：将第三方库拷贝进系统（不可取，这样会使系统的存储空间越来越大）

②：gcc 主文件 -l文件名 -L. （-l：链接一个库；-L：指定库存放的路径；.：当前路径）

2、制作动态库的方法：

（1）、将功能函数文件编译生成动态库：gcc -shared -fPIC 文件 -o 目标文件（.so）

（2）、使用方法：gcc 主文件动态库的路径（./动态库）

Q3：总结CMake的用法。

（一）对单个文件下的CMake的使用

1、创建*.c文件，并且在源文件的同级目录下创建CMakeLists.txt文件；（CMakeLists.txt和hello.c在同一目录下）

注意不要把CMakeLists.txt文件写错！！！

2、编写*.c文件和CMakeLists.txt文件；

hello.c

CMakeLists.txt

注：CMakeLists.txt中设计的cmake命令

project（工程名称）
project指令会自动创建两个变量：
<projectname>_BINARY_DIR (binary file save path)
<projectname>_SOURCE_DIR（source code save path）
创建的这两个变量，分别与系统中的PROJECT_BINARY_DIR和PROJECT_SOURCE_DIR值相等；
add_executable(A.exe，A.c)
A.c的源文件生成A.exe的可执行文件
3、在与CMakeLists.txt所在的目录下，创建一个build的文件夹；