mxnet问题整理(二)

最新推荐文章于 2022-01-03 13:15:31 发布

库页

最新推荐文章于 2022-01-03 13:15:31 发布

阅读量699

点赞数

分类专栏：深度学习文章标签： mxnet

本文链接：https://blog.csdn.net/daniaokuye/article/details/80893667

版权

深度学习专栏收录该内容

61 篇文章 1 订阅

订阅专栏

在mxnet中需要对conv进行修改，所以遇到了一些问题，选择难理解的问题记下来。

1. 修改完conv层函数之后，出现输出结果是null的问题

按照以下的方式来就好了

class new_conv(nn.Conv2D):
    def __init__(self, channels, kernel_size, **kwargs):
        # if isinstance(kernel_size, base.numeric_types):
        #     kernel_size = (kernel_size,)*2
        # assert len(kernel_size) == 2, "kernel_size must be a number or a list of 2 ints"
        super(new_conv, self).__init__(channels, kernel_size, **kwargs)

    def forward(self, x, *args):
        self.ctx = x.context
        self.set_params()
        return super(new_conv, self).forward(x, *args)

2. 网络模型参数获取

for key, val in self.params.items():
    # key = self.params.keys()
    if 'weight' in key:
        data = val.data()
        mask = netMask[key]

3. 网络参数的赋值（1）

网络参数的普通的赋值可以使用set_data()，但是网络参数的处理一般都会在构建的网络图之中。所以，最好的采取一种不会再autograd.record()出现错误的处理方式。

def assign_params(self, key, multiplier):
    """Sets this parameter's value on all contexts."""
    # self.shape = multiplier.shape
    out = []
    for arr in self.params[key].list_data():
        out.append((nd.multiply(arr, multiplier)).as_in_context(self.ctx))
    if len(out) == 1:
        self.params[key]._data = out #这里需要格外的注意，必须是list形式。我在这儿捯饬了好大一会
    else:
        self.params[key]._data = [nd.stack(*out, axis=1)]
    print('o')

4. 对网络参数处理的说明

对网络参数的处理，可能还会遇到其他各种各样的问题，所以渔具是啥呢？

在/usr/local/lib/python2.7/dist-packages/mxnet/gluon/parameter.py中，可以找到很多对网络参数处理的环节。比如读取都会指向这么一个函数 def _check_and_get(self, arr_list, ctx)，上面提到的赋值时需要的list格式，就是无论如何都是以list的形式出现的。这就有data和ctxlist配合的问题。

def _check_and_get(self, arr_list, ctx):
    if arr_list is not None:
        if ctx is list:
            return arr_list
        if ctx is None:
            if len(arr_list) == 1:
                return arr_list[0]
            else:
                ctx = context.current_context()
        ctx_list = self._ctx_map[ctx.device_typeid&1]
        if ctx.device_id < len(ctx_list):
            idx = ctx_list[ctx.device_id]
            if idx is not None:
                return arr_list[idx]##重点看这儿，arr_list是数据，所以外面要加[]，变成list形式，不然就被取多维数据第一维度的第一个index。

5. 对网络参数的赋值（2）

如果以在（1）中的方式对网络参数赋值，可以达到不至于不能构建计算图的效果。但是，系统认定是节点的权重的一个子集（也包括它本身）参与构建计算图。所以在计算梯度的时候，需要特别指定ignore_stale_grad——即忽略不在计算图中的梯度。

如果不想这样的话，还是有办法的。

netMask={}
class new_conv(nn.Conv2D):
    def __init__(self, channels, kernel_size, **kwargs):
        # if isinstance(kernel_size, base.numeric_types):
        #     kernel_size = (kernel_size,)*2
        # assert len(kernel_size) == 2, "kernel_size must be a number or a list of 2 ints"
        super(new_conv, self).__init__(channels, kernel_size, **kwargs)

    # def  forward(self, x, *args):
    #     return super(new_conv, self).forward(x, *args)
    
    def hybrid_forward(self, F, x, weight, bias=None): #使用重写hybrid_forward的方法，该方法是conv2D所继承的类中的函数，显示的调用了weight
        keys = self.params.keys()
        self.assign_mask(keys)
        for key in keys:
            if 'weight' in key:
                wmask = netMask[key]
            else:
                bmask = netMask[key]
        return super(new_conv, self).hybrid_forward(F, x, weight * wmask, bias * bmask)

6. python的类的相关

这更是关于python编程相关的，目前用到了，所以将他们写出来。

在使用mxnet的dataloader的时候，可以指定的一个参数是sampler,就是指定一个epoch下的可用样本。在不显式指定该参数的情况下，程序也会自己创建一个sampler。但是需要将给变量指定为一个可迭代的量。所以在编程的时候，有一点点小技巧，可以让这个更灵活。

class SubsetRandomSampler():
    """
    exclude is a instance of SubsetRandomSampler
    """

    def __init__(self, length, subs, exclude=None):
        self._length = length
        self._subs = subs
        self.exclude = exclude #这是一个SubsetRandomSampler的对象，用到它是为了形成互补的训练集和验证集


    def __iter__(self):
        random.seed(random.randint(1, 100))
        indices = range(self._length)
        if self.exclude:
            try:
                indices = set(indices) - set(self.exclude.out)
            except Exception, e:
                pass
            self.exclude = None
        self.out = random.sample(indices, self._subs)
        return iter(self.out) #注意这儿，返回的就是一个迭代量，所以变得更灵活一些。

    def __len__(self):
        return self._subs

在调用的时候，就可以如下使用，并确保二者为互补数据集：

train_sampler = SubsetRandomSampler(num_train, num_ratio)
valid_sampler = SubsetRandomSampler(num_train, num_train - num_ratio, train_sampler)

另外，如果类是一个可直接调用的，比如当使用该对象的时候，函数会自动跳转到forward之类的方式等这种实现的时候，就可以直接当作参数传递，程序会变的更灵活。比如这样：

def __init__(self, num_classes=10574, verbose=False, my_fun=nn.Conv2D, **kwargs):

库页

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录