正则化是为了防止过拟合现象的出现,什么是过拟合
在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题,过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测准确率较低。
过拟合是很多机器学习的通病。如果模型过拟合,那么得到的模型几乎不能用。为了解决过拟合问题,一般会采用模型集成的方法,即训练多个模型进行组合。此时,训练模型费时就成为一个很大的问题,不仅训练多个模型费时,测试多个模型也是很费时。
下面是关于对散点划出分界线的代码
# -*- coding: utf-8 -*-
"""
Created on Tue Mar 19 20:44:32 2019
@author: Admin
"""
import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
BATCH_SIZE=8
seed=2
#基于seed生成随机数
rdm=np.random.RandomState(seed)
#随机数返回300行2列的矩阵,表示300组坐标点(x0,x1)作为输入数据
X=rdm.randn(300,2)
#从X中取出一行,判断如果两个坐标的平方和小于2,为Y赋值1否则)
#作为输入数据集的标签(正确答案)
Y_=[int(x0*x0+x1*x1<2) for (x0,x1) in X]
#遍历Y中的每个袁术,1赋值‘red’其余值赋值为'blue'这样可视化显示时人可以直接区分