正则化——gluon

最新推荐文章于 2020-10-26 21:40:34 发布

lizzy05

最新推荐文章于 2020-10-26 21:40:34 发布

阅读量305

点赞数

分类专栏： python machine learning 文章标签： mxnet gluon

本文链接：https://blog.csdn.net/lizzy05/article/details/80160185

版权

machine learning 同时被 2 个专栏收录

37 篇文章 0 订阅

订阅专栏

python

28 篇文章 1 订阅

订阅专栏

from mxnet import ndarray as nd
from mxnet import autograd
from mxnet import gluon
import mxnet as mx

import random

num_train = 20
num_test = 100
num_inputs = 200

true_w = nd.ones((num_inputs, 1)) * 0.01
true_b = 0.05
#生成训练数据和测试数据集
X = nd.random.normal(shape=(num_train + num_test, num_inputs))
y = nd.dot(X, true_w) + true_b
y += .01 * nd.random.normal(shape=y.shape)

X_train, X_test = X[:num_train, :], X[num_train:, :]
y_train, y_test = y[:num_train], y[num_train:]

#迭代器---定义一个函数它每次返回batch_size个随机的样本和对应的目标
batch_size = 1
def data_iter(num_examples):
    idx = list(range(num_examples))
    random.shuffle(idx)
    for i in range(0, num_examples, batch_size):
        j = nd.array(idx[i:min(i+batch_size,num_examples)])
        yield X.take(j), y.take(j)

D:\Users\Administrator\Anaconda3\lib\site-packages\h5py\__init__.py:36: FutureWarning: Conversion of the second argument of issubdtype from `float` to `np.floating` is deprecated. In future, it will be treated as `np.float64 == np.dtype(float).type`.
  from ._conv import register_converters as _register_converters

#初始化模型参数
def init_params():
    w = nd.random_normal(scale=1, shape=(num_inputs, 1))
    b = nd.zeros(shape=(1,))
    params = [w, b]
    for param in params:
        param.attach_grad()
    return params

#L2范数正则化
def L2_penalty(w, b):
    return ((w**2).sum() + b**2) / 2

#定义训练和测试
%matplotlib inline
import matplotlib as mpl
mpl.rcParams['figure.dpi']= 120
import matplotlib.pyplot as plt
import numpy as np

def net(X, w, b):
    return nd.dot(X, w) + b

def square_loss(yhat, y):
    return (yhat - y.reshape(yhat.shape)) ** 2 / 2

def sgd(params, lr, batch_size):
    for param in params:
        param[:] = param - lr * param.grad / batch_size

def test(net, params, X, y):
    return square_loss(net(X, *params), y).mean().asscalar()
    #return np.mean(square_loss(net(X, *params), y).asnumpy())

def train(lambd):
    epochs = 10
    learning_rate = 0.005
    w, b = params = init_params()
    train_loss = []
    test_loss = []
    for e in range(epochs):
        for data, label in data_iter(num_train):
            with autograd.record():
                output = net(data, *params)
                loss = square_loss(
                    output, label) + lambd * L2_penalty(*params)
            loss.backward()
            sgd(params, learning_rate, batch_size)
        train_loss.append(test(net, params, X_train, y_train))
        test_loss.append(test(net, params, X_test, y_test))
    plt.plot(train_loss)
    plt.plot(test_loss)
    plt.legend(['train', 'test'])
    plt.show()
    return 'learned w[:10]:', w[:10].T, 'learned b:', b

train(0)

 
     ('learned w[:10]:',  
    

 
     [[ 0.30372193 -0.08122482 0.6469477 -1.5169737 0.16486691 0.42008066 
    

    0.4117703   0.8333592  -0.66504014  3.563324  ]]
 <NDArray 1x10 @cpu(0)>, 'learned b:', 
 [0.12570551]
 <NDArray 1 @cpu(0)>)

train(5)

 
     ('learned w[:10]:',  
    

 [[ 0.01271132  0.00323896 -0.01058104  0.00074889 -0.00690441  0.00848945
    0.01372818 -0.00713685  0.00431851 -0.00840096]]
 <NDArray 1x10 @cpu(0)>, 'learned b:', 
 [0.00537223]
 <NDArray 1 @cpu(0)>)

#gluon 
#高维线性回归数据集
from mxnet import ndarray as nd
from mxnet import autograd
from mxnet import gluon
import mxnet as mx

num_train = 20
num_test = 100
num_inputs = 200

true_w = nd.ones((num_inputs, 1)) * 0.01
true_b = 0.05

X = nd.random.normal(shape=(num_train + num_test, num_inputs))
y = nd.dot(X, true_w) + true_b
y += .01 * nd.random.normal(shape=y.shape)

X_train, X_test = X[:num_train, :], X[num_train:, :]
y_train, y_test = y[:num_train], y[num_train:]

#定义训练和测试
%matplotlib inline
import matplotlib as mpl
mpl.rcParams['figure.dpi']= 120
import matplotlib.pyplot as plt
import numpy as np

batch_size = 1
dataset_train = gluon.data.ArrayDataset(X_train, y_train)
data_iter_train = gluon.data.DataLoader(dataset_train, batch_size, shuffle=True)

square_loss = gluon.loss.L2Loss()

def test(net, X, y):
    return square_loss(net(X), y).mean().asscalar()

def train(weight_decay):
    epochs = 10
    learning_rate = 0.005
    net = gluon.nn.Sequential()
    with net.name_scope():
        net.add(gluon.nn.Dense(1))
    net.collect_params().initialize(mx.init.Normal(sigma=1))

    # 注意到这里 'wd'
    trainer = gluon.Trainer(net.collect_params(), 'sgd', {
        'learning_rate': learning_rate, 'wd': weight_decay})

    train_loss = []
    test_loss = []
    for e in range(epochs):
        for data, label in data_iter_train:
            with autograd.record():
                output = net(data)
                loss = square_loss(output, label)
            loss.backward()
            trainer.step(batch_size)
        train_loss.append(test(net, X_train, y_train))
        test_loss.append(test(net, X_test, y_test))
    plt.plot(train_loss)
    plt.plot(test_loss)
    plt.legend(['train','test'])
    plt.show()

    return ('learned w[:10]:', net[0].weight.data()[:,:10],
            'learned b:', net[0].bias.data())

train(0)

 
     ('learned w[:10]:',  
    

 [[-1.2421037   0.08937309  0.48468193 -2.474812    1.6000378  -0.7002478
    1.003187   -1.7175496   0.46522993  0.9414017 ]]
 <NDArray 1x10 @cpu(0)>, 'learned b:', 
 [-0.13920185]
 <NDArray 1 @cpu(0)>)

train(5)

 
     ('learned w[:10]:',  
    

 [[ 0.0030201  -0.00451496  0.00090438 -0.001776   -0.00489771  0.00282109
   -0.00575881 -0.00393021  0.00229077  0.01102347]]
 <NDArray 1x10 @cpu(0)>, 'learned b:', 
 [0.0032311]
 <NDArray 1 @cpu(0)>)