caffe中DataTransformer类方法Transform中data_index的计算原理

最新推荐文章于 2021-05-12 22:38:05 发布

视觉弘毅

最新推荐文章于 2021-05-12 22:38:05 发布

阅读量317

点赞数

文章标签： caffe c++

本文链接：https://blog.csdn.net/weixin_41041772/article/details/105253204

版权

问题抛出：

int top_index, data_index;
  for (int c = 0; c < datum_channels; ++c) {
    for (int h = 0; h < height; ++h) {
      for (int w = 0; w < width; ++w) {
        //data_index是如何计算的?
        data_index = (c * datum_height + h_off + h) * datum_width + w_off + w;
        if (do_mirror) {
          top_index = (c * height + h) * width + (width - 1 - w);
        } else {
          top_index = (c * height + h) * width + w;
        }
        if (has_uint8) {
          datum_element =
            static_cast<Dtype>(static_cast<uint8_t>(data[data_index]));
        } else {
          datum_element = datum.float_data(data_index);
        }
        if (has_mean_file) {
          transformed_data[top_index] =
            (datum_element - mean[data_index]) * scale;
        } else {
          if (has_mean_values) {
            transformed_data[top_index] =
              (datum_element - mean_values_[c]) * scale;
          } else {
            transformed_data[top_index] = datum_element * scale;
          }
        }
      }
    }
  }
}

原理的分析：

首先，我们需要知道Datum的来龙去脉：

1、首先通过caffe的数据转换工具（如convert_mnist_data.cpp)将图像标签等写入数据库（LMDB等），代码如下所示：

  char label;
  char* pixels = new char[rows * cols];
  int count = 0;
  string value;

  Datum datum;
  datum.set_channels(1);
  datum.set_height(rows);
  datum.set_width(cols);
  LOG(INFO) << "A total of " << num_items << " items.";
  LOG(INFO) << "Rows: " << rows << " Cols: " << cols;
  for (int item_id = 0; item_id < num_items; ++item_id) {
    image_file.read(pixels, rows * cols);//将二进制数据流写入pixels
    label_file.read(&label, 1);
    datum.set_data(pixels, rows*cols);
    datum.set_label(label);
    string key_str = caffe::format_int(item_id, 8);
    datum.SerializeToString(&value);

    txn->Put(key_str, value);

2、然后在训练时，通过DataReader从数据库中读取数据（异步操作）

3、进而通过DataLayer的load_batch对数据进行加工处理并生成对应的batch数据。

4、在load_batch函数中调用了DataTransformer的Transform进行数据的预处理