深度学习笔记：神经网络的学习（1）

VIP文章 Raine_Yang

于 2023-01-26 21:57:22 发布

阅读量464

点赞数

分类专栏：人工智能文章标签：深度学习神经网络人工智能 python numpy

本文链接：https://blog.csdn.net/Raine_Yang/article/details/128682091

版权

机器学习的核心在于从数据中提取规律和特征，并用于分类或预测。对于识别手写数字，如果人工设计一个识别算法逻辑是十分困难的。一种方法是任务在数据中提取更重要的特征量，然后利用机器学习算法如SVM或KNN。而神经网络的方法则是完全由机器自主提取特征，中间没有任何人工干预

1 训练数据和测试数据

一般来说，机器学习的数据分为训练数据（或监督数据）和测试数据。首先使用训练数据寻找最优参数，然后使用测试数据评估模型泛化能力。

泛化能力指的是模型处理未被观察到数据的能力，是机器学习的目标。

如果模型只能处理特定数据集，泛化能力差，这种状态被称为过拟合（over fitting）

2 损失函数

神经网络利用损失函数作为指标表现现在的状态，再利用这一指标寻找更优权重参数。损失函数表现了网络和数据集不拟合程度，损失函数越低，网络更优

均方差法（mean squared error）：
在这里插入图片描述
yk: 神经网络输出
tk：监督数据
（k代表数据维数）

import numpy as np

def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t) ** 2)


t = np.array([0, 0, 1, 0, 0, 0, 0, 0, 0, 0])
y = np.array([0.1, 0.05, 0.6, 0, 0.05, 0.1, 0, 0.1,

最低0.47元/天解锁文章

Raine_Yang

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记：神经网络的学习（1）

x_train形状为（60000， 784），因为训练数据集个数60000，输入数据784维（28 X 28），t_train形状为（60000, 10），训练数据集个数60000，监督数据one-hot标签量为10。为了弥补这一误差，我们可以计算函数在(x + h) 和(x - h)间的差分，称为中心差分。一般来说，机器学习的数据分为训练数据（或监督数据）和测试数据。由于tk的one-hot表示里只有正确解值为1，其他解值为0.交叉熵的值为-log(y)，其中y为正确解的输出概率。
复制链接

扫一扫