fftw 编译安装说明

FFTW优化编译指南

最新推荐文章于 2025-09-20 16:05:25 发布

原创最新推荐文章于 2025-09-20 16:05:25 发布 · 1.1w 阅读

34 ·

CC 4.0 BY-SA版权

文章标签：

#数学 #库 #编译 #FFTW #测试

本文详细介绍FFTW库的优化编译方法，包括如何选择编译器、设置编译参数以利用特定CPU架构的特性，如SSE、AVX等，并提供针对Intel CPU的编译示例。

FFTW 数学库

官网地址：

http://www.fftw.org/

下载地址：

http://www.fftw.org/download.html

目前最新版本为

Version 3.3.6 is the latest stable release of FFTW ( 截止2017-04-30）

1．什么是DFT?

DFT（Discrete Fourier Transform），即离散傅里叶变换，是傅里叶变换在时域和频域上都呈离散的形式,将信号的时域采样变换为其DTFT的频域采样。

2．什么是FFT?

FFT（Fast Fourier Transformation），即为快速傅氏变换，是离散傅氏变换（DFT）的快速算法，它是根据离散傅氏变换的奇、偶、虚、实等特性，对离散傅立叶变换的算法进行改进获得的。

3．什么是FFTW?

FFTW ( the Faster Fourier Transform in the West)是一个快速计算离散傅里叶变换的标准C语言程序集，其由MIT的M.Frigo和S. Johnson开发。可计算一维或多维实和复数据以及任意规模的DFT。

4．FFTW库所需的编译环境

Intel Compiler /GNU Compiler + MPI Compiler （如果编译mpi版的fftw）

5．安装 Intel Compiler编译器，设置编译环境（如果使用intel的编译器）

如果使用的是Intel的CPU，建议使用Intel的编译器。

详细安装方法参见博客相关文章。

例如使用TH-1A的Intel 2013编译器编译lammps，可以加载如下环境变量：

source /opt/intel/composer_xe_2013.0.079/bin/iccvars.sh intel64    
source /opt/intel/composer_xe_2013.0.079/bin/ifortvars.sh intel64

6．安装 MPI Compiler ，设置编译环境

编译并行版的程序需要并行编译器，例如MPI并行的程序需要MPI编译器，常用的MPI例如Intel MPI 、MPICH、OPENMPI等。

不同的机器可能针对自身硬件进行MPI优化，天河系统的MPI是基于开源MPICH进行的二次开发优化，进而支持性能卓越的天河自主高速互联网络。

详细安装方法参见博客相关文章。

例如使用TH-1A的Intel 2013编译器编译的mpich，可以加载如下环境变量：

export MPI_HOME=/usr/local/mpi-intel2013
export PATH=$MPI_HOME/bin:$PATH      
export LD_LIBRARY_PATH=$MPI_HOME/lib:$LD_LIBRARY_PATH

7．默认编译fftw-3.3.6

安装fftw仅需要遵循常见的三步骤即可（configure+make+make install），在这里先介绍一下默认安装，再然着重介绍一些configure的配置选项。

以fftw-3.3.6-pl2.tar.gz为例，先从官网下载该压缩包。解压缩，并进入源码目录进行编译即可。

tar zxvf fftw-3.3.6-pl2.tar.gz
cd fftw-3.3.6-pl2
./configure
make
make install

这样就可以把fftw库按照默认配置，安装到默认的路径下。

使用的是GNU的编译器，安装到的是/usr/local下面。

8．优化编译参数介绍

但是，我们通常会依据./configure -help得到的信息来添加一些参数来达到优化编译的目录。

接下来我们使用命令查看一些常用配置参数：

Installation directories:

--prefix=PREFIX install architecture-independent files in PREFIX[/usr/local]

设定安装目录

Optional Features:

--enable-shared[=PKGS] build shared libraries [default=no]

是否编译动态库

--enable-static[=PKGS] build static libraries [default=yes]

是否编译静态库

--enable-single compile fftw in single precision

--enable-float synonym for --enable-single

是否编译单精度版本

--enable-sse enable SSE optimizations

--enable-sse2 enable SSE/SSE2 optimizations

--enable-avx enable AVX optimizations

--enable-avx2 enable AVX2 optimizations

--enable-neon enable ARM NEON optimizations

开启针对特定机器架构的优化，这个取决于机器CPU（下面有介绍）。

--enable-fma enable optimizations for machineswith fused multiply-add

开启积和熔加运算(Fused Multiply-Add/FMA)的优化

--enable-mpi compile FFTW MPI library

是否编译mpi版的fftw库

--enable-openmp use OpenMP directives for parallelism

是否使用OpenMP指令进行并行

--enable-threads compile FFTW SMP threads library

是否编译FFTW SMP线程库

Some influential environment variables:

CC C compiler command

CFLAGS C compiler flags

CPP C preprocessor

MPICC MPI C compiler command

F77 Fortran 77 compiler command

FFLAGS Fortran 77 compiler flags

这部分是指定编译器及编译参数，默认是用GNU的编译器。

为了用intel的编译器，我们需要特别指定一下：CC=icc F77=ifort，相关的参数通常保持默认即可。

备注：

1）如何查看CPU是否支持某个指令集呢？使用如下命令可以列出支持的指令集名称

cat /proc/cpuinfo | grep flags | uniq

2）SIMD

SIMD单指令流多数据流(SingleInstructionMultiple Data,SIMD)是一种采用一个控制器来控制多个处理器，同时对一组数据（又称“数据向量”）中的每一个分别执行相同的操作从而实现空间上的并行性的技术。

MMX是由英特尔开发的一种SIMD多媒体指令集，SSE（Streaming SIMDExtensions）是MMX的扩充指令集，AVX（Advanced VectorExtensions）是Intel的SSE延伸架构，FMA（Fused MultiplyAccumulate）是Intel的AVX扩充指令集。

NEON实际上是ARM的SIMD（Single InstructionMultiple Data）技术的延续，它是一个结合64和128 bit的SIMD（Single InstructionMultiple Data 单指令多重数据）指令集。

9．优化编译单双精度版本的FFTW

tar zxvf fftw-3.3.3.tar.gz
cd fftw-3.3.3

# 单精度
./configure --prefix=$HOME/software/fftw/3.3.6-pl2-icc13 \
  CC=icc F77=ifort \
  --enable-shared --enable-static \
  --enable-float \
  --enable-sse --enable-sse2 \
  --enable-avx --enable-avx2 --enable-fma \
  --enable-mpi \
  --enable-threads--enable-openmp
make
make install

# clean一下
make clean

# 双精度
./configure --prefix=$HOME/software/fftw/3.3.6-pl2-icc13 \
  CC=icc F77=ifort \
  --enable-shared --enable-static \
  --enable-sse2 --enable-avx --enable-avx2 --enable-fma \
  --enable-mpi \
  --enable-threads--enable-openmp
make
make install

欢迎交流！