Blob数据结构是caffe中基本的数据存储单元,它主要存储的数据是网络中的中间数据变量,比如各层的输入和输出;代价函数关于网络各层参数的梯度。为什么要专门为数据设计一个存储结构,我的理解是这样保证的网络中的数据存储结构的统一性,由于网络中每个网络的计算过程都是相似的,所以如果能把数据存储也统一起来,使得整个程序也就很有结构。
1,Blob中除了存储重要的数据之外,还有一些标记数据的参数,下面就罗列一下Blob中的数据成员:
protected:
shared_ptr<SyncedMemory> data_;
shared_ptr<SyncedMemory> diff_;
shared_ptr<SyncedMemory> shape_data_;
vector<int> shape_;
int count_;
int capacity_;
data_:表示网络各层的输入和输出;
diff_:表示代价函数相对于各层参数的梯度;
shape_:是一个可变数组,shape_中主要存储4个变量:num表示一个batch中的样本数量,从这我们可以看出Blob的存储是以batch为基本单位的;chennels表示对应层的通道,比如卷积层有20个卷积核,channels的值就是20;height和width就表示单个数据的尺寸,可能是一副图像的尺寸,也可能表示卷积核的尺寸,在每一层所代表的含义也不相同。
count_:表示这个Blob里已经存储的元素的个数;
capacity_:表示这个Blob的容量;
网上说可以把Blob看作一个四维的数组,其实是可以从这个角度看,但是本质上Blob还是一维的存储结构,只不过是利用四个参数来进行寻址(shape_里的四个参数)。所以说Blob其实并不是含有什么复杂的结构。
2,Blob中除了数据成员之外,也有很多用于操作数据的函数成员,下面就说几个比较重要的:
void Blob<Dtype>::Reshape():这个函数是在原来分配的内存不够的情况下重新分配内存。
const Dtype* Blob<Dtype>::cpu_data():这个是获取Blob结构体中的data_数据的指针,同时限制不能对返回的指针指向的内容进行更改。
const Dtype* Blob<Dtype>::cpu_diff():这个是获取Blob结构体中的diff_数据的指针,同时限制不能对返回的指针指向的内容进行更改。
Dtype* Blob<Dtype>::mutable_cpu_data():获取Blob结构体中的data_数据的指针,同时可以对指针指向的内容更改。
Dtype* Blob<Dtype>::mutable_cpu_diff():获取Blob结构体中的diff_数据的指针,同时可以对指针指向的内容更改。
void Blob<Dtype>::ShareData(const Blob& other):让其他Blob的data_数据和当前Blob共享。
void Blob<Dtype>::ShareDiff(const Blob& other):让其他Blob的diff_和当前的Blob共享。
这就是关于Blob的主要内容,关于Blob中的SyncedMemory数据类型,这里不深究,现在只知道data_和diff_都是使用这种数据类型构造数据。