paddlepaddle-DNN实现鸢尾花分类任务

最新推荐文章于 2023-02-11 22:34:25 发布

Alex-Leung

最新推荐文章于 2023-02-11 22:34:25 发布

阅读量1.3k

点赞数 2

分类专栏： Python 深度学习神经网络文章标签： paddlepaddle DNN 深度学习机器学习 python

本文链接：https://blog.csdn.net/a2824256/article/details/107683799

版权

Python 同时被 3 个专栏收录

58 篇文章 3 订阅

订阅专栏

深度学习

29 篇文章 1 订阅

订阅专栏

神经网络

14 篇文章 0 订阅

订阅专栏

1. 前期准备

首先先准备鸢尾花的数据集，csv数据集下载地址
鸢尾花有三种分类，类别分别用0, 1, 2表示
paddlepaddle选用版本为1.8

2. 导入包

from __future__ import print_function
import paddle
import paddle.fluid as fluid
import numpy as np
import math
import csv
from paddle.utils.plot import Ploter
import sys

3. 数据预处理

# 存放数据集的数组
TRAIN_DATA = []
TEST_DATA = []
TRAIN_RES = []
TEST_RES = []
# 定义数据集路径
TRAIN_FILE = "./iris_training.csv"
TEST_FILE = "./iris_test.csv"

# 将csv数据转化为ndarray数据
def data_pretreatment():
    # train
    with open(TRAIN_FILE) as f:
        render = csv.reader(f)
        for row in render:
            if len(row) != 0:
                TRAIN_DATA.append([row[0], row[1], row[2], row[3]])
                TRAIN_RES.append([row[4]])

    # test
    with open(TEST_FILE) as f:
        render = csv.reader(f)
        for row in render:
            if len(row) != 0:
                TEST_DATA.append([row[0], row[1], row[2], row[3]])
                TEST_RES.append([row[4]])

4. Data Reader

def train_sample_reader():
    for i in range(120):
        input = np.array(TRAIN_DATA).astype('float32')
        label = np.array(TRAIN_RES).astype('int64')
        yield input, label

def test_sample_reader():
    for i in range(30):
        input = np.array(TEST_DATA).astype('float32')
        label = np.array(TEST_RES).astype('int64')
        yield input, label

5. 网络结构

# DNN (4, 10, 20, 10, 3)
INPUT = fluid.data(name='input', shape=[None, 4], dtype='float32')
LABEL = fluid.data(name='label', shape=[None, 1], dtype='int64')
hidden = fluid.layers.fc(name='fc1', input=INPUT, size=10, act='relu')
hidden = fluid.layers.fc(name='fc2', input=hidden, size=20, act='relu')
hidden = fluid.layers.fc(name='fc3', input=hidden, size=10, act='relu')
prediction = fluid.layers.fc(name='soft', input=hidden, size=3, act='softmax')

6. 训练

def train(executor, program, reader, feeder, fetch_list):
    accumulated = 1 * [0]
    count = 0
    for data_test in reader():
        outs = executor.run(program=program,
                            feed=feeder.feed(data_test),
                            fetch_list=fetch_list)
        accumulated = [x_c[0] + x_c[1][0] for x_c in zip(accumulated, outs)]
        count += 1  
    return [x_d / count for x_d in accumulated]


data_pretreatment()
train_reader = fluid.io.batch(train_sample_reader, batch_size=100)
test_reader = fluid.io.batch(test_sample_reader, batch_size=100)


# main program
main_program = fluid.default_main_program()  # 获取默认/全局主函数
startup_program = fluid.default_startup_program()

# loss
loss = fluid.layers.mean(fluid.layers.cross_entropy(input=prediction, label=LABEL))
acc = fluid.layers.accuracy(input=prediction, label=LABEL)

# test program
test_program = main_program.clone(for_test=True)
adam = fluid.optimizer.Adam(learning_rate=0.01)
adam.minimize(loss)

place = fluid.CUDAPlace(0)
exe = fluid.Executor(place)

num_epochs = 100


params_dirname = "./my_paddle_model"
feeder = fluid.DataFeeder(place=place, feed_list=[INPUT, LABEL])
exe.run(startup_program)
train_prompt = "train cost"
test_prompt = "test cost"

%matplotlib inline
plot_prompt = Ploter(train_prompt, test_prompt)
step = 0

exe_test = fluid.Executor(place)

for pass_id in range(num_epochs):
    for data_train in train_reader():
        step = step + 1
        avg_loss_value, = exe.run(main_program, feed=feeder.feed(data_train), fetch_list=[loss])
        if step % 10 == 0:
            plot_prompt.append(train_prompt, step, avg_loss_value[0])
            plot_prompt.plot()
            print("%s, Step %d, Cost %f" % (train_prompt, step, avg_loss_value[0]))
        if step % 10 == 0: 
            test_metics = train(executor=exe_test, program=test_program, reader=test_reader, fetch_list=[loss.name], feeder=feeder)
            plot_prompt.append(test_prompt, step, test_metics[0])
            plot_prompt.plot()
            print("%s, Step %d, Cost %f" % (test_prompt, step, test_metics[0]))
            if test_metics[0] < 10.0:  # 如果准确率达到要求，则停止训练
                break

        if math.isnan(float(avg_loss_value[0])):
            sys.exit("got NaN loss, training failed.")

        #  保存训练参数到之前给定的路径中
        if params_dirname is not None:
            fluid.io.save_inference_model(params_dirname, ['input'], [prediction], exe)

6.1 运行效果

运行效果

6.2 导出模型的说明

下面代码把整个网络模型的结构和权重都导出，在下一节将使用这个模型来进行预测测试

fluid.io.save_inference_model(params_dirname, ['input'], [prediction], exe)

7. 预测实验

# 保存预测的结果图
def save_result(points1, points2):
    import matplotlib
    matplotlib.use('Agg')
    import matplotlib.pyplot as plt
    x1 = [idx for idx in range(len(points1))]
    y1 = points1
    y2 = points2
    l1 = plt.plot(x1, y1, 'r--', label='predictions')
    l2 = plt.plot(x1, y2, 'g--', label='GT')
    plt.plot(x1, y1, 'ro-', x1, y2, 'g+-')
    plt.title('predictions VS GT')
    plt.legend()
    plt.savefig('./my_paddle_model/prediction_gt.png')

infer_exe = fluid.Executor(place)
inference_scope = fluid.core.Scope()

pred_array = []

with fluid.scope_guard(inference_scope):
	# 载入预训练模型
    [inference_program, feed_target_names,
     fetch_targets] = fluid.io.load_inference_model(params_dirname, infer_exe) 
    batch_size = 10
    iris_reader = fluid.io.batch(
        test_reader, batch_size=10
    )
    iris_feat = np.array(TEST_DATA).astype("float32")
    iris_label = np.array(TEST_RES).astype("int64")

    assert feed_target_names[0] == 'input'
    results = infer_exe.run(inference_program,
                            feed={feed_target_names[0]: np.array(iris_feat)},
                            fetch_list=fetch_targets)

    print("Iris results: (Iris Type)")
    for idx, val in enumerate(results[0]):
        pred = val.tolist().index(np.max(val))
        pred_array.append([pred])
        print("%d: %f" % (idx, pred))  # 打印预测结果

    save_result(pred_array, iris_label)

7.1 预测结果与GroundTruth的比较

0, 1, 2分别代表三种鸢尾花
预测与GT的比较

8. 导出权重

假如有导出权重给硬件使用的需求，可以通过下面代码导出权重，最后把数据拼接成自己定义的格式

from __future__ import print_function
import paddle.fluid as fluid
import numpy as np


params_dirname = "./my_paddle_model"
place = fluid.CUDAPlace(0)
infer_exe = fluid.Executor(place)
inference_scope = fluid.core.Scope()


with fluid.scope_guard(inference_scope):
    [inference_program, feed_target_names,
     fetch_targets] = fluid.io.load_inference_model(params_dirname, infer_exe)

	# 导出16位float精度的权重
    # fc1_w = np.array(fluid.global_scope().find_var('fc1.w_0').get_tensor()).astype("float16")
    fc1_w = np.array(fluid.global_scope().find_var('fc1.w_0').get_tensor())
    fc1_b = np.array(fluid.global_scope().find_var('fc1.b_0').get_tensor())
    fc2_w = np.array(fluid.global_scope().find_var('fc2.w_0').get_tensor())
    fc2_b = np.array(fluid.global_scope().find_var('fc2.b_0').get_tensor())
    fc3_w = np.array(fluid.global_scope().find_var('fc3.w_0').get_tensor())
    fc3_b = np.array(fluid.global_scope().find_var('fc3.b_0').get_tensor())
    soft_w = np.array(fluid.global_scope().find_var('soft.w_0').get_tensor())
    soft_b = np.array(fluid.global_scope().find_var('soft.b_0').get_tensor())

Alex-Leung

关注

2
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
paddlepaddle-DNN实现鸢尾花分类任务

paddlepaddle实现鸢尾花分类任务1. 前期准备2. 导入包3. 数据预处理4. Data Reader5. 网络结构6. 训练6.1 运行效果6.2 导出模型的说明7. 预测实验7.1 预测结果与GroundTruth的比较8. 导出权重1. 前期准备首先先准备鸢尾花的数据集，csv数据集下载地址paddlepaddle选用版本为1.82. 导入包from __future__ import print_functionimport paddleimport paddle.fluid
复制链接

扫一扫