boost源码剖析之:泛型多维数组类multi_array

本文详细剖析了Boost库中的multi_array类,该类用于创建和管理动态的多维数组。文章介绍了multi_array的构造方式,包括通过boost::extents和集合概念两种方法,强调了使用boost::extents的编译期检查优势。此外,文章探讨了multi_array的内部架构,包括类继承层次和存储策略,展示了其与C++内置多维数组一致的访问方式。最后,作者指出,这种实现提供了高效且与内建数组兼容的访问,增强了代码的可重用性和可扩展性。
摘要由CSDN通过智能技术生成

boost源码剖析之:boost::multi_array

 

谢轩 刘未鹏

C++的罗浮宫(http://blog.csdn.net/pongba)

 

Note: 并非新作,是以前和老朋友谢轩写的,也可以在谢轩的blog上找到。 

 

动机

      C++是一门自由的语言,允许你自由的表达自己的意图,对不对? 所以我们既然可以new一个一维数组,也应该可以new出多维数组,对不对?先来看一个例子:

         int* pOneDimArr = new int[10]; //新建一个10个元素的一维数组

         pOneDimArr[0] = 0; //访问

         int** pTwoDimArr = new int[10][20]; //错误!

         pTwoDimArr[0][0] = 0; //访问

     但是,很可惜,三四两行代码的行为并非如你所想象的那样——虽然从语法上它们看起来是那么自然

     这里的问题在于,new int[10][20]返回的并非int**类型的指针,而是int (*)[20]类型的指针(这种指针被称为行指针,对它“+1”相当于在数值上加上一行的大小(本例为20),也就是说,让它指向下一行),所以我们的代码应该像这样:

int (*pTwoDimArr)[20] = new int[i][20]; //正确

pTwoDimArr[1][2] = 0; //访问

     注意pTwoDimArr的类型——int(*)[20]是个很特殊的类型,它不能转化为int**,虽然两者索引元素的语法形式一样,都是“p[i][j]”的形式,但是访问内存的次数却不一样,语义也不一样。

     最关键的问题还是:以上面这种朴素的方式来创建多维数组,有一个最大的限制,就是:除了第一维,其它维的大小都必须是编译期确定的。例如:

     int (*pNdimArr)[N2][N3][N4] = new int[n1][N2][N3][N4];

     这里N2,N3,N4必须都是编译期常量,只有n1可以是变量,这个限制与多维数组的索引方式有关——无论多少维的数组都是线性存储在内存中的,所以:

         pTwoDimArr[i][j] = 0;

被编译器生成的代码类似于:

         *( (int*)pTwoDimArr+i*20+j ) = 0;

     20就是二维数组的行宽,问题在于,如果允许二维数组的行宽也是动态的,这里编译器就无法生成代码(20所在的地方应该放什么呢?)。基于这个原因,C++只允许多维数组的第一维是动态的。

     不幸的是,正由于这个限制,C++中的多维数组就在大多数情况下变成了有名无实的无用之物。我们经常可以在论坛上看到关于多维数组的问题,一般这类问题的核心都在于:如何模仿一个完全动态的多维数组。这里完全动态的意思是,所有维的大小都可以是动态的变量,而不仅是第一维。论坛上给出的答案不一而足,有的已经相当不错,但是要么缺乏可扩展性(即扩展到N维的情况),要么在访问元素的形式上远远脱离了内建的多维数组的访问形式,要么消耗了额外的空间。归根到底,我们需要的是一个类似这样的多维数组实现:

 

     //创建一个int型的3维数组,dim_sizes表示各维的大小:n1*n2*n3

     multi_array<int,3> ma ( dim_sizes[n1][n2][n3] );

     ma[i][j][k] = value; //为第ijk列的元素赋值

     ma[i][j] = value; //编译错!

     ma[i] = value; //编译错!

     ma[i][j][k][l] = value;//编译错!

 

这样一个multi_array,能够自动管理内存,拥有和内建多维数组一致的界面,并且各维的大小都可以是变量——正符合我们的要求。看起来,实现这个multi_array并非难事,但事实总是出乎想象,下面就是对boost中已有的一个multi_array实现的剖析——你几乎肯定会发现一些出乎意料的(甚至是令人惊奇的)地方。

 

Boost中的多维数组实现——boost::multi_array

 

Boost库中就有一个用于描述多维数组的功能强大的MultiArray库。它实现了一个通用、与标准库的容器一致的接口,并且具有与C++中内建的多维数组一样的界面和行为。正是这种设计,使得MultiArray库与标准库组件甚至用户自定义的泛型组件之间可以具有很好的兼容性,使它们能够很好协同工作。除此之外,MultiArray还提供了诸如改变大小、重塑(reshaping)以及对多维数组的视图访问等极为有用的特性,从而使MultiArray比其它描述多维数组的组件(譬如:std::vector< std::vector<…> > )更为便捷、高效。对示例程序进行调试、跟踪是分析库源代码最有效的手段之一。我们就从MultiArray文档中的示例程序入手:

 

// 略去头文件包含

int main () {

     // 创建一个尺寸为3×4×2的三维数组

     #define DIMS 3 //数组是几维的

     typedef boost::multi_array<double,DIMS> array_type; // (1-1)

     array_type A(boost::extents[3][4][2]);   // (1-2)

     // 为数组中元素赋值

     A[1][2][0] = 120;      // (1-3)

     ... ...

     return 0;

}

 

在上述代码中,(1-1)处的typedef是我们程序中使用的三维数组类型的声明,很明显,boost::multi_array的两个模板参数分别代表数组元素的类型和数组的维度。而(1-2)处就是三维数组对象的构造语句。boost::extents[3][4][2]的意思是:定义一个3*4*2的三维数组。

下面我就为你层层剥开boost::extents的所有奥秘——

 

extents——与内建数组一致的方式

boost::extents是一个全局对象,在base.hpp中:

 

     typedef detail::multi_array::extent_gen<0> extent_gen;

     ... ...

     multi_array_types::extent_gen extents; //注意它的类型!

 

可见extents的类型为extent_gen,这个extend_gen则位于extent_gen.hpp中:

 

// extent_gen.hpp

     template <std::size_t NumRanges>

     class extent_gen {

       range_list ranges_;    // 2-1

       ... ...

       extent_gen(const extent_gen<NumRanges-1>& rhs, const range& a_range)                  // 2-2

       {

std::copy(rhs.ranges_.begin(),rhs.ranges_.end(),ranges_.begin());

              *ranges_.rbegin() = a_range;

       }

       extent_gen<NumRanges+1>

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
一组新的多维数组模板 by chen3feng(RoachCock@smth) email: chen3feng@163.com, chen3fengx@163.com, chen3fengx@hotmail.com [引言] 在C/C++开发中,多维数组是一个让很多人感到棘手的问题.原因是C/C++中,多维数组被看 作是数组数组. 在向函数传递参数的时候,多维数组经常让人感到是麻烦的制造者,通常都是传递首地址 和每一维的大小: void foo(int *,int ,int);; int a[10][10];; foo(&a[0][0],10,10);; //... 十分的麻烦,在函数中访问时也得自己用乘法来计算元素的位置,更是十分麻烦. C99标准推出了可变大小的多维数组,当然,实现该标准的编译器还不多,但是也从一个方 面说明了变量大小的多维数组是很有用的. C++标准直到现在还不支持,明年(2003年)的新标准也不知道会不会加进去.但是C++程序 员自己有办法,利用C++的模板,运算符重载等技巧,完全可以构建出方便实用的多维数组 我抢在明年之前做出这组模板,也希望即使新标准增加了变量大小的多维数组,我的工 作也仍有一些意义, :) 另外,多维数组的空间是连续的,这跟用vector of vector实现的不一样,可以用迭代器 从头到脚挨个摸一遍. boost库也提供了多维数组,当然还有别的几个数组.我感觉boost多维数组的缺点 就是只支持动态数组,对静态和动态数组没有一个统一的非GP的接口,因此我着重于这方 面的改进, [简介] 该组有以下几个模板组成 1. template <;typename T, size_t DimNum>; class array_base;; 该是其他几个数组的基 // 由于编译器对C++标准实现参差不齐的原因,该实际 上不是根,不过应用中不需要知道这一点. 提供了基本的功能,比如[]运算符,迭代器的型声明,迭代器的获取,value_type等的定 义等 等 2. template <;typename T, size_t d1, size_t d2 = -1, size_t d3 = -1>; class static_array;; 静态的数组,从array_base派生而来,因此除了兼容也是由array_base派生出来的其他 外,还有自己的特点,就是提供了一个elements的public成员,直接暴露给用户,访问 速度可以很快. 3. template<;typename T,size_t DimNum, typename A=std::allocator<;T>; >; class dynamic_array;; //:public array_base<;T, DimNum>; 看得出也是从array_base派生的,另外,他是可以resize的.还支持reserve等STL容器的操 作. 4. template <;typename T, size_t DimNum, typename A=std::allocator<;T>; >; class shared_array;; //: public array_base<;T, DimNum>; 就是支持引用计数的动态数组啦.不过刚写了个外皮,内容还没开工,因为我最近要回家. sorry! [用法] 先要包含各自的头文件: #include ";static_array.hpp"; #include ";dynamic_array.hpp"; #include ";shared_array.hpp"; 1.然后就可以定义对象 cfc::static_array<;int,10>; sa1;; cfc::static_array<;int,10, 10>; sa2;; cfc::static_array<;int,10, 10, 10>; sa3;; cfc::dynamic_array<;int, 1>; da1(cfc::extents[10],10);; cfc::dynamic_array<;int, 2>; da2(cfc::extents[10][10], 10);; cfc::dynamic_array<;int, 3>; da3(cfc::extents[10][10][10], 10);; cfc::shared_array<;int,1>; sha1(cfc::extents[10]]);; cfc::shared_array<;int,2>; sha2(cfc::extents[10][10]);; cfc::shared_array<;int,3>; sha3(cfc::extents[10][10][10]);; extents是一个数组的维度生成器,用起来的很方便,跟boost学的,不过没仔细看它的实现 ,我觉得我的也不错,哈哈 2.访问元素: sa1[0] = 0;; da1[0] = 0;; sa2[0][0] = 0;; da2[0][0] = 0;; sa3[0][0][0] = 0;; da3[0][0][0] = 0;; 3.比较相等与否: bool f;; f = sa1==sb1;; f = da1==da1;; f = sa1==da1;; // 说明:只提供了==和!=,别的没提供,我觉得别的意义大 4.交换: cfc::swap(da1,db1);; cfc::swap(sa1,sb1);; cfc::swap(sa1,db1);; //说明:动态数组的交换很高效,换个指针而已, :) 5.resize: da3.resize(cfc::extents[10][100][1]);; da3.resize(cfc::extents[10][50][1]);; da3.resize(cfc::extents[10][10][20]);; da3.resize(cfc::extents[10][10][10]);; //说明:只有动态数组才能resize, 还有将来的shared_array, zz 6.赋值: da3 = db3;; sa1 = sb1;; da1 = db1;; 静态数组维度不一样不能赋值,否则会引起编译错误 动态数组和丢失了静态大小成为了array_base的数组维度不一样时,赋值引发 std::length_error异常,可以捕捉到, 比较也是这样 7.作为函数的参数 还举开头的那个例子 void foo(array_base<;int,2>; &a) { a[0][0]=10;; } 8.重要概念 <;子数组>; 高维数组的子型,也就是低一维的数组. 子数组型为array_base,支持array_base的所有操作,但是不再支持原来数组的特定 操作子数组由[]运算符得到, sa3[0] da3[0] //型均为array_base<;int,2>; 子数组还可以在取子数组 da3[0][1];;//型为array_base<;int,1>; [性能] 三维大小均为100的静态,动态,原生数组以及boost::multi_array.以三重循环每次隔一个 填充, 我测试的结果,速度大概是原生数组的60%,boost数组的速度是原生数组的1/5,因此速度 大概是boost的3倍. 如果用迭代器顺序访问的话,跟原生数组相比就区别不大了.但是代码要好写一点,而且直 接支持STL算法. [实现与移植] 由于要兼顾各种编译器,而且是在VC6上做的,因此像模板偏特化等特性都不能用,需要变 通,因此相当繁琐,由此可见一个好的编译器多么重要啊. 不过话说回来,这样的代码移植性才好呢.想想连VC6都能编译的代码,移植性应该不错, :) [后记] 这是对以前的那个多维数组的扩充与改进,增加了不少功能,去掉了不少限制, 现在静态数组的最大维数做到了3,动态数组的维数不限//你需要多高维数的?维数越高越 慢, :) 由于时间不多,精力和水平有限,其中的缺点和错误欢迎指正,也十分欢迎哪位能帮我进一 步提高访问速度. 谢谢! 附带测试程序,其中包括与boost::multi_array<;>;的速度比较代码. //the end. ^=^
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值