2020-07-06

最新推荐文章于 2023-02-06 16:31:30 发布

Yumilo

最新推荐文章于 2023-02-06 16:31:30 发布

阅读量247

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/Yumilo/article/details/107170415

版权

笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

苏嵌嵌入式Linux实训第三天

总的来说，最近事很多，该来的不该来的都来了。哎，自己克服困难吧！！！
1.编译器三级优化分别优化了哪些?
第一级：代码调整
代码调整是一种局部的思维方式；基本上不触及算法层级；它面向的是代码，而不是问题；所以：语句调整，用汇编重写、指令调整、换一种语言实现、换一个编译器、循环展开、参数传递优化等都属于这一级；
这个级别的优化需要掌握大量的小的优化技巧和知识，需要不断的积累；
简单的语句调整、公共表达式提取、废代码删除等当前的很多编译器也能做到了，但也需要了解一些编译器的优化能力使自己的代码配合编译器做好优化；
用汇编重写并不是简单把高级语言改写为汇编实现，那样写的汇编很可能没有当今的编译器产生的代码好，所以如果决定用汇编实现，那就应该按照汇编的角度来规划自己的实现，适当的参考编译器生成的汇编码也是可取的(特别是新手，我也一样)；在某些领域，使用CPU的新特性和新的指令集等将产生巨大的性能收益，这些地方经常采用汇编来实现。
在优化的第一个级别执行基础代码的优化。这个级别试图执行9种单独的优化功能：
-fdefer-pop: 这种优化技术与汇编语言代码在函数完成时如何进行操作有关。一般
情况下, 函数的输入值被保存在堆栈中并且被函数访问。函数返回时, 输入值还在
堆栈中。一般情况下, 函数返回之后, 输入值被立即弹出堆栈。这样做会使堆栈中
的内容有些杂乱。
-fmerge-constans: 使用这种优化技术, 编译器试图合并相同的常量. 这一特性有
时候会导致很长的编译时间, 因为编译器必须分析c或者c++程序中用到的每个常量，
并且相互比较他们.
-fthread-jumps: 使用这种优化技术与编译器如果处理汇编代码中的条件和非条件
分支有关。在某些情况下, 一条跳转指令可能转移到另一条分支语句。通过一连串
跳转, 编译器确定多个跳转之间的最终目标并且把第一个跳转重新定向到最终目标。
-floop-optimize: 通过优化如何生成汇编语言中的循环，编译器可以在很大程序上
提高应用程序的性能。通常, 程序由很多大型且复杂的循环构成。通过删除在循环
内没有改变值的变量赋值操作, 可以减少循环内执行指令的数量, 在很大程度上提高
性能。此外优化那些确定何时离开循环的条件分支，以便减少分支的影响。
-fif-conversion: if-then语句应该是应用程序中仅次于循环的最消耗时间的部分。
简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支。通过减少
或者删除条件分支, 以及使用条件传送设置标志和使用运算技巧来替换他们, 编译
器可以减少if-then语句中花费的时间量。
-fif-conversion2: 这种技术结合更加高级的数学特性，减少实现if-then语句所
需的条件分支。
-fdelayed-branch: 这种技术试图根据指令周期时间重新安排指令。它还试图把
尽可能多的指令移动到条件分支前, 以便最充分的利用处理器的治理缓存。
-fguess-branch-probability: 就像其名称所暗示的, 这种技术试图确定条件分支最可
能的结果, 并且相应的移动指令, 这和延迟分支技术类似。因为在编译时预测代码的安排，
所以使用这一选项两次编译相同的c或者c++代码很可能会产生不同的汇编语言代码，这取决
于编译时编译器认为会使用那些分支。因为这个原因, 很多程序员不喜欢采用这个特性, 并且
专门地使用-fno-guess-branch-probability选项关闭这个特性
-fcprop-registers: 因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少
调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作。

第二级：新的视角
新的视角强调的重点是针对问题的算法；即选择和构造适合于问题的算法；（冒泡排序还是快排的选择问题是这一级早就应该完成的）很多经典算法都对问题作了一些假设(包括我们当前已经完成的算法实现)，而在面对实际问题时“新的视角”提示我们应该重新检视这些假设，并尝试不同的思考问题的角度，寻求适合于问题的新算法；
发掘问题的本来意义，从不同的角度思考面对的问题，使用适合于问题的的算法; 尝试打破一些规则，发掘和怀疑自己的某些假定，恢复问题的本来面目；
结合了第一个级别的所有优化技术, 再加上一下一些优化：
-fforce-mem: 这种优化再任何指令使用变量前, 强制把存放再内存位置中的所有变量都复制到寄存器
中。对于只涉及单一指令的变量, 这样也许不会有很大的优化效果. 但是对于再很多指令(必须数学操作)
中都涉及到的变量来说, 这会时很显著的优化, 因为和访问内存中的值相比 ,处理器访问寄存器中的值要
快的多。
-foptimize-sibling-calls: 这种技术处理相关的和/或者递归的函数调用。通常, 递归的函数调用
可以被展开为一系列一般的指令，而不是使用分支。这样处理器的指令缓存能够加载展开的指令并且
处理他们, 和指令保持为需要分支操作的单独函数调用相比, 这样更快。
-fstrength-reduce: 这种优化技术对循环执行优化并且删除迭代变量。迭代变量是捆绑到循环计数器
的变量, 比如使用变量, 然后使用循环计数器变量执行数学操作的for-next循环。
-fgcse：这种技术对生成的所有汇编语言代码执行全局通用表达式消除历程。这些优化操作试图分析
生成的汇编语言代码并且结合通用片段，消除冗余的代码段。如果代码使用计算性的goto, gcc指令推荐
使用-fno-gcse选项。
-fcse-follow-jumps: 这种特别的通用子表达式消除技术扫描跳转指令, 查找程序中通过任何其他途径都不
会到达的目标代码。这种情况最常见的例子就式if-then-else语句的else部分。
-frerun-cse-after-loop: 这种技术在对任何循环已经进行过优化之后重新运行通用子表达式消除例程。
这样确保在展开循环代码之后更进一步地优化还编代码。
-fdelete-null-pointer-checks: 这种优化技术扫描生成的汇编语言代码, 查找检查空指针的代码。编译
器假设间接引用空指针将停止程序。如果在间接引用之后检查指针，它就不可能为空。
-fextensive-optimizations: 这种技术执行从编译时的角度来说代价高昂的各种优化技术，但是它可能
对运行时的性能产生负面影响。
-fregmove: 编译器试图重新分配mov指令中使用的寄存器, 并且将其作为其他指令操作数, 以便最大化
捆绑的寄存器的数量。
-fschedule-insns: 编译器将试图重新安排指令, 以便消除等待数据的处理器。对于在进行浮点运算时有
延迟的处理器来说，这使处理器在等待浮点结果时可以加载其他指令。
-fsched-interblock: 这种技术使编译器能够跨越指令块调度指令。这可以非常灵活地移动指令以便等待
期间完成的工作最大化。
-fcaller-saves: 这个选项指示编译器对函数调用保存和恢复寄存器, 使函数能够访问寄存器值, 而且不必
保存和恢复他们。如果调用多个函数, 这样能够节省时间, 因为只进行一次寄存器的保存和恢复操作, 而
不是在每个函数调用中都进行。
-fpeephole2: 这个选项允许进行任何计算机特定的观察孔优化。
-freorder-blocks: 这种优化技术允许重新安排指令块以便改进分支操作和代码局部性。
-fstrict-aliasing: 这种技术强制实行高级语言的严格变量规则。对于c和c++程序来说, 它确保不在数据
类型之间共享变量. 例如, 整数变量不和单精度浮点变量使用相同的内存位置。
-funit-at-a-time: 这种优化技术指示编译器在运行优化例程之前读取整个汇编语言代码。这使编译器可以
重新安排不消耗大量时间的代码以便优化指令缓存。但是, 这会在编译时花费相当多的内存, 对于小型计算机可能
是一个问题。
-falign-functions: 这个选项用于使函数对准内存中特定边界的开始位置。大多数处理器按照页面读取内存，
并且确保全部函数代码位于单一内存页面内, 就不需要叫化代码所需的页面。
-fcrossjumping: 这是对跨越跳转的转换代码处理，以便组合分散在程序各处的相同代码。这样可以减少
代码的长度，但是也许不会对程序性能有直接影响。

第三级：表驱动状态机
将问题抽象为另一种等价的数学模型或假想机器模型，比如构造出某种表驱动状态机；这一级其实是第二级的延伸，只是产生的效果更加明显，但它有其本身的特点（任何算法和优化活动都可以看作是他的投影）；这一级一般可以产生无与伦比的快速程序，要达到这一级需要大量修炼的;并且思考时必须放弃很多已有的概念或者这些概念不再重要，比如：变量、指针、空间、函数、对象等，剩下的只应该是那个表驱动状态机；我想把这种境界描述为：空寂中，一些输入驱动着一个带有状态的机器按设定好的最短路线运转着；除此之外have nothing; 既：把解决一个问题的算法看作一个机器，它有一些可变的状态、有一些记忆、有一些按状态运行的规则，然后一些输入驱动这个机器运转；这就是第三级要求的思考优化问题的切入点，也就是寻找一部机器，使它运行经过的路径最短(可能是速度也可能是空间等等)
它整合了第一和第二级别中的左右优化技巧, 还包括一下优化:
-finline-functions: 这种优化技术不为函数创建单独的汇编语言代码，而是把函数代码包含在调度程序的
代码中。对于多次被调用的函数来说, 为每次函数调用复制函数代码。虽然这样对于减少代码长度不利, 但是
通过最充分的利用指令缓存代码, 而不是在每次函数调用时进行分支操作, 可以提高性能。
-fweb: 构建用于保存变量的伪寄存器网络。伪寄存器包含数据, 就像他们是寄存器一样, 但是可以使用各种
其他优化技术进行优化, 比如cse和loop优化技术。
-fgcse-after-reload: 这中技术在完全重新加载生成的且优化后的汇编语言代码之后执行第二次gcse优化,
帮助消除不同优化方式创建的任何冗余段。

2、总结gcc静态库和动态库的制作；

1、-c 只编译，生产.o文件，不进行链接；-o 制定目标名称, 默认的时候, gcc 编译出来的文件是 a.out。

g++ -c main.cpp -o main.o
2、-Wall 提示更多警告信息；-On n = 0~3 ,编译优化，n越大优化的越多。

g++ main.cpp -Wall -O0 -o app
g++ main.cpp -Wall -O1 -o app1
g++ main.cpp -Wall -O3 -o app2
3、-D 编译时定义宏（下面代码运行会输出Hello World！）；-g 包含调试信息(GDB调试器需要，编译出来的程序比不加-g时编译出来的程序要大)

g++ main.cpp -D DEBUG -g -o app

#include
using namespace std;

int main()
{
int a = 112;
#ifdef DEBUG
cout << “Hello World!” << endl;
#endif
cin.get();
return 0;
}

4、-I 指定头文件目录（include是当前目录下的文件夹，head.h在这个目录下）

g++ main.cpp -I include -o app

#include
#include “head.h”
using namespace std;

int main()
{
int a = 112;
cout << "NUM1 + NUM2 = " << NUM1 + NUM2 << endl;
#ifdef DEBUG
cout << “Hello World!” << endl;
#endif
cin.get();
return 0;
}

5、静态库的制作与使用

head .h 放在 include 文件夹

#ifndef HEAD_H
#define HEAD_H

#include <stdio.h>

int add(int, int);
int sub(int, int);
int mul(int, int);

#endif

add.c，sub.c，mul.c放在 src 文件夹下，

int add(int a, int b)
{
return a + b;
}
int sub(int a, int b)
{
return a - b;
}
int mul(int a, int b)
{
return a * b;
}
生成 .o 文件

gcc *.c -c -I …/include
生成静态库

ar rcs libMyCalc.a *.o
将静态库 libMyCalc.a 移动到上级 lib 文件夹

mv libMyCalc.a …/lib/
静态库的使用：编译 main.c 与（include、lib、src文件夹在同一目录）

第一种编译方法：

gcc main.c ./lib/libMyCalc.a -I include -o app
第二章编译方法：

gcc main.c -Iinclude -L lib -l MyCalc -o app
6、动态库的制作与使用

使用的文件与上面制作静态库使用的文件及目录是一样的。

生成 .o 文件（生成与位置无关的代码）

gcc -fPIC -c *.c -I …/include
生成动态库

gcc -shared -o libMyCalc.so *.o -I …/include
将动态库 libMyCalc.so 移动到上级 lib 文件夹

mv libMyCalc.so …/lib/
动态库的使用：编译 main.c 与（include、lib、src文件夹在同一目录）

第一种编译方法：

gcc main.c lib/libMyCalc.so -o app -I include
第二种编译方法：

gcc main.c -L ./lib -l MyCalc -o MyApp -I include
下面的命令可以查看我们的程序需要链接的动态库

ldd MyApp
解决动态库链接失败的问题：

第一种方法：放到系统的库目录 ./lib 中（但是这种方法不允许使用，你懂得）。

第二种方法：将动态库的路径设置给环境变量 LD_LIBRARY_PATH，然后将设置的值，导入到系统环境变量中。（这种方法临时测试的时候可以使用，终端关闭就会失效）

export LD_LIBRARY_PATH=./lib
第三种方法（不常用的方法，永久设置）：在家目录的.bashrc文件中添加下面的一句话

export LD_LIBRARY_PATH=./lib
第四种方法（常用）：找到动态链接器的配置文件 /etc/ld.so.conf 将动态库的绝对路径写到配置文件（需要管理员权限）。然后需要使用下面的命令更新即可。
3、总结CMake用法；
一、基本使用

安装：下载二进制包后可直接解压使用

从源码安装则执行命令：./bootstrap; make; make install——尝试执行bootstrap失败

使用：cmake dir_path，生成工程文件或makefile文件

二、概念

out-of-source build，与in-source build相对，即将编译输出文件与源文件放到不同目录中；

三、基本结构

1，依赖CMakeLists.txt文件，项目主目标一个，主目录中可指定包含的子目录；

2，在项目CMakeLists.txt中使用project指定项目名称，add_subdirectory添加子目录

3，子目录CMakeLists.txt将从父目录CMakeLists.txt继承设置（TBD，待检验）

四、语法

```
  #注释
```

  变量：使用set命令显式定义及赋值，在非if语句中，使用${}引用，if中直接使用变量名引用；后续的set命令会清理变量原来的值；

  command (args ...)  #命令不分大小写，参数使用空格分隔，使用双引号引起参数中空格

  set(var a;b;c) <=> set(var a b c)  #定义变量var并赋值为a;b;c这样一个string list

  Add_executable(${var}) <=> Add_executable(a b c)   #变量使用${xxx}引用

```
  条件语句：
```

if(var) #var 非empty 0 N No OFF FALSE… #非运算使用NOT

…

else()/elseif() … endif(var)

```
  循环语句
```

Set(VAR a b c)

Foreach(f ${VAR}) …Endforeach(f)

```
  循环语句
```

WHILE() … ENDWHILE()

五、内部变量

CMAKE_C_COMPILER：指定C编译器

CMAKE_CXX_COMPILER：

CMAKE_C_FLAGS：编译C文件时的选项，如-g；也可以通过add_definitions添加编译选项

EXECUTABLE_OUTPUT_PATH：可执行文件的存放路径

LIBRARY_OUTPUT_PATH：库文件路径

CMAKE_BUILD_TYPE:：build 类型(Debug, Release, …)，CMAKE_BUILD_TYPE=Debug

BUILD_SHARED_LIBS：Switch between shared and static libraries

内置变量的使用：

在CMakeLists.txt中指定，使用set

cmake命令中使用，如cmake -DBUILD_SHARED_LIBS=OFF

六、命令

project (HELLO) #指定项目名称，生成的VC项目的名称；

使用${HELLO_SOURCE_DIR}表示项目根目录

include_directories：指定头文件的搜索路径，相当于指定gcc的-I参数

include_directories (${HELLO_SOURCE_DIR}/Hello) #增加Hello为include目录

link_directories：动态链接库或静态链接库的搜索路径，相当于gcc的-L参数

   >> link_directories (${HELLO_BINARY_DIR}/Hello)     #增加Hello为link目录

add_subdirectory：包含子目录

   >> add_subdirectory (Hello)

add_executable：编译可执行程序，指定编译，好像也可以添加.o文件

   >> add_executable (helloDemo demo.cxx demo_b.cxx)   #将cxx编译成可执行文件——

add_definitions：添加编译参数

add_definitions(-DDEBUG)将在gcc命令行添加DEBUG宏定义；

add_definitions( “-Wall -ansi –pedantic –g”)

target_link_libraries：添加链接库,相同于指定-l参数

target_link_libraries(demo Hello) #将可执行文件与Hello连接成最终文件demo

add_library:

add_library(Hello hello.cxx) #将hello.cxx编译成静态库如libHello.a

add_custom_target:

message( status|fatal_error, “message”):

set_target_properties( … ): lots of properties… OUTPUT_NAME, VERSION, …

link_libraries( lib1 lib2 …): All targets link with the same set of libs

Yumilo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

2020-07-06

苏嵌嵌入式Linux实训 第三天

苏嵌嵌入式Linux实训第三天