机器学习实战教程（第二章机器学习基本理论）

最新推荐文章于 2024-09-24 08:41:20 发布

thesby

最新推荐文章于 2024-09-24 08:41:20 发布

阅读量673

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/thesby/article/details/50894055

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

简单分类

训练数据样本包含输入向量以及对应的目标向量的应用被称作有监督学习，例如MNIST手写识别。如果训练样本仅有输入向量，而没有目标向量，则称为是无监督学习。

若一个输入样本的目标是将其映射到有限个离散标签中的一个，则称其为分类问题；若一个样本的目标是将其映射到一个连续区间，则称其为回归问题。

增强学习关注的是在给定条件下，找到合适的动作，使得获得的奖励达到最大值。所以这种学习没有给定最优目标，而Agent需要在一系列试验中寻找最优解。

多项式拟合

通过多项式拟合，我们来看看什么叫欠拟合和过拟合。
设N个样本构成的矩阵为 $x = (x_1, x_2, ... , x_N)^T$ ，对应的观测值为 $t = (t_1, t_2, ..., t_N)^T$ 。对应的拟合值为 $y = y(x, W) = w_0 + w_1 * x + w_2 * x^2+...+w_M *x^M$ , 由此构成的代价函数为：

E (W) = 1 2 * \sum n = 1 N {y (x n, w) - t n}

$E(W) = \frac{1}2 *\sum_{n=1}^N\{y(x_n, w) - t_n\}$ ，所以目标就是最小化代价函数，使得整体上y与t最接近。
示例：
设要拟合的函数为

sin(2π∗x) $sin(2\pi * x)$

# -*- coding: utf-8 -*-
"""
Created on Tue Mar 15 09:02:46 2016

@author: thesby
"""

import numpy as np
import matplotlib.pylab as plt

x = range(10);
x = np.asarray(x, dtype=np.float32)
x = x / 10
#x = np.transpose(x)
t = np.sin(x*2*np.pi)
y = t + 0.1 * np.random.rand(10)

M = 1
p = np.polyfit(x, y,deg=M)
predict = np.polyval(p,x)
cost = np.sum(np.square(predict-y))
plt.figure()
plt.plot(x, y, '*')
x_show = range(100)
x_show = np.asarray(x_show, dtype=np.float32) / 100
t_show = np.sin(2 * np.pi * x_show)
predict_show = np.polyval(p, x_show)
plt.plot(x_show, t_show)
plt.plot(x_show, predict_show)
plt.show()