用mindspore定义一个双层神经网络拟合抛物面

最新推荐文章于 2023-11-30 14:42:31 发布

阿袁的小园子

最新推荐文章于 2023-11-30 14:42:31 发布

阅读量437

点赞数

分类专栏： python 文章标签：神经网络深度学习 python

本文链接：https://blog.csdn.net/yuanren201/article/details/124755960

版权

python 专栏收录该内容

36 篇文章 3 订阅

订阅专栏

mindspore（后文简称为ms）目前网上的使用者以及文章太少了，对于像我这种没有阅读官方文档的人来说属实有点不易，这里记录一下我用mindspore实现单层和双层神经网络拟合抛物面的代码。
详细代码在https://github.com/yuanzilin/PatternRecognition/tree/main/lab4中的BP_mindspore.ipynb中

一、简化版流程

主要有5个步骤：
1.定义网络结构
2.定义损失函数
3.定义反向传播网络
4.开始训练
5.用训练完成的模型对测试集进行推理
除了第1步，后面4个步骤可以用以下几行代码实现

from mindspore import nn
from mindspore.train import Model
epochs=2000
# 实例化网络
net=MyNet_double(2,3,4,1)
# 定义损失函数
net_loss=nn.loss.MSELoss()
# 定义反向传播网络
opt=nn.Momentum(net.trainable_params(),learning_rate=0.01,momentum=0.9)
# 关联前向和反向传播网络，注意，metrics不能漏，即使你不需要mindspore提供的测试指标，也要把这个参数传进去
model=Model(net,net_loss,opt,metrics={"loss"})
# 这一步跑了特别长时间，花了58分钟
model.train(epochs,ds_train,dataset_sink_mode=False)
p=model.predict(test_X)

二、注意事项

主要是model.train()和model.predict()时需要处理一下数据的输入格式

1.ms只能处理特定格式的数据，比如我有一个数据集如下，第一列为x1,第二列为x2，第三列为y
在这里插入图片描述
那么这个文件转化成ms可以处理的格式的方法如下：

# 读取训练数据，这里有3个注意点：
# 1.需要把数据都转成ms.float32，因为定义网络结构时，默认生成的权重都是ms.float32类型的
# 2.由于使用mindspore.dataset.GeneratorDataset把数据集转成合适的格式时，接收的数据格式为[[x1,y1],[x2,y2],...],因此读取数据时要按这个格式存储数据
# 3.不要转化成np.array，否则用ms.dataset.GeneretorDataset后无法用create_dict_generator()获取分batch后的数据值
def readData(path):
    lines=open(path,"r",encoding="utf-8").readlines()
    train_X=[]
    for l in lines:
        data=l.strip().split(" ")
        tmp=[]
        x=[]
        # x.append(Tensor(float(data[0]),ms.float32))
        # x.append(Tensor(float(data[1]),ms.float32))
        x.append(float(data[0]))
        x.append(float(data[1]))
        tmp.append(Tensor(x,ms.float32))
        tmp.append(Tensor(float(data[2]),ms.float32))
        train_X.append(tmp)
    return train_X   
# 定义数据增强函数，这一步就是把数据集转换成ms.model.train可以接受的数据格式
# ds.GeneratorDataset可以接受的格式为一个list，list的格式为[[x1,y1],[x2,y2],...]
from mindspore import dataset as ds
def create_dataset(data,batch_size=4):
    input_data=ds.GeneratorDataset(data,column_names=["data","label"],column_types=[ms.float32,ms.float32])
    input_data=input_data.batch(batch_size)
    return input_data     
train_data=readData("paraboloid_train.txt")
ds_train=create_dataset(train_data)

其中train_data[0]的输出为：
在这里插入图片描述
可以用如下方法查看ds.GeneratorDataset处理后的数据内容：

cnt=0
for i in ds_train.create_dict_iterator():
    print(i["data"],["label"])
    cnt+=1
    if cnt==3:
        break

输出为：
在这里插入图片描述

2.model.predict时，这个predict只能接转化成Tensor类型的np.array数组或者list，比如要调用这行代码进行预测：

predict_sphere=model.predict(Tensor(test_x))

那么这个test_x可以是这样：
在这里插入图片描述

参考文档：
1.mindspore官方文档：https://www.mindspore.cn/docs/zh-CN/r1.7/index.html
2.实现简单线性函数拟合：https://www.mindspore.cn/tutorial/zh-CN/r0.7/quick_start/linear_regression.html
3.使用MindSpore实现简单线性函数拟合:https://gitee.com/mindspore/docs/blob/r1.0/tutorials/notebook/linear_regression.ipynb