用mindspore定义一个双层神经网络拟合抛物面

mindspore(后文简称为ms)目前网上的使用者以及文章太少了,对于像我这种没有阅读官方文档的人来说属实有点不易,这里记录一下我用mindspore实现单层和双层神经网络拟合抛物面的代码。
详细代码在https://github.com/yuanzilin/PatternRecognition/tree/main/lab4中的BP_mindspore.ipynb中

一、简化版流程

主要有5个步骤:
1.定义网络结构
2.定义损失函数
3.定义反向传播网络
4.开始训练
5.用训练完成的模型对测试集进行推理
除了第1步,后面4个步骤可以用以下几行代码实现

from mindspore import nn
from mindspore.train import Model
epochs=2000
# 实例化网络
net=MyNet_double(2,3,4,1)
# 定义损失函数
net_loss=nn.loss.MSELoss()
# 定义反向传播网络
opt=nn.Momentum(net.trainable_params(),learning_rate=0.01,momentum=0.9)
# 关联前向和反向传播网络,注意,metrics不能漏,即使你不需要mindspore提供的测试指标,也要把这个参数传进去
model=Model(net,net_loss,opt,metrics={"loss"})
# 这一步跑了特别长时间,花了58分钟
model.train(epochs,ds_train,dataset_sink_mode=False)
p=model.predict(test_X)

二、注意事项

主要是model.train()和model.predict()时需要处理一下数据的输入格式

1.ms只能处理特定格式的数据,比如我有一个数据集如下,第一列为x1,第二列为x2,第三列为y
在这里插入图片描述
那么这个文件转化成ms可以处理的格式的方法如下:

# 读取训练数据,这里有3个注意点:
# 1.需要把数据都转成ms.float32,因为定义网络结构时,默认生成的权重都是ms.float32类型的
# 2.由于使用mindspore.dataset.GeneratorDataset把数据集转成合适的格式时,接收的数据格式为[[x1,y1],[x2,y2],...],因此读取数据时要按这个格式存储数据
# 3.不要转化成np.array,否则用ms.dataset.GeneretorDataset后无法用create_dict_generator()获取分batch后的数据值
def readData(path):
    lines=open(path,"r",encoding="utf-8").readlines()
    train_X=[]
    for l in lines:
        data=l.strip().split(" ")
        tmp=[]
        x=[]
        # x.append(Tensor(float(data[0]),ms.float32))
        # x.append(Tensor(float(data[1]),ms.float32))
        x.append(float(data[0]))
        x.append(float(data[1]))
        tmp.append(Tensor(x,ms.float32))
        tmp.append(Tensor(float(data[2]),ms.float32))
        train_X.append(tmp)
    return train_X   
# 定义数据增强函数,这一步就是把数据集转换成ms.model.train可以接受的数据格式
# ds.GeneratorDataset可以接受的格式为一个list,list的格式为[[x1,y1],[x2,y2],...]
from mindspore import dataset as ds
def create_dataset(data,batch_size=4):
    input_data=ds.GeneratorDataset(data,column_names=["data","label"],column_types=[ms.float32,ms.float32])
    input_data=input_data.batch(batch_size)
    return input_data     
train_data=readData("paraboloid_train.txt")
ds_train=create_dataset(train_data)    

其中train_data[0]的输出为:
在这里插入图片描述
可以用如下方法查看ds.GeneratorDataset处理后的数据内容:

cnt=0
for i in ds_train.create_dict_iterator():
    print(i["data"],["label"])
    cnt+=1
    if cnt==3:
        break

输出为:
在这里插入图片描述

2.model.predict时,这个predict只能接转化成Tensor类型的np.array数组或者list,比如要调用这行代码进行预测:

predict_sphere=model.predict(Tensor(test_x))

那么这个test_x可以是这样:
在这里插入图片描述

参考文档:
1.mindspore官方文档:https://www.mindspore.cn/docs/zh-CN/r1.7/index.html
2.实现简单线性函数拟合:https://www.mindspore.cn/tutorial/zh-CN/r0.7/quick_start/linear_regression.html
3.使用MindSpore实现简单线性函数拟合:https://gitee.com/mindspore/docs/blob/r1.0/tutorials/notebook/linear_regression.ipynb

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值