利用循环神经网络生成唐诗_数据挖掘--神经网络建模

通过神经网络节点来创建并训练神经网络。它通过模拟大量相互连接的简单处理单元工作,这些处理单元是按层排列的。在神经网络中通常有3部分:一个输入层,其单元代表输入字段;一个或者更多的隐藏层;以及一个输出层,其单元代表输出字段。这些单元通过不断变化的连接强度或权值连接。神经网络节点模型如下图所示。

9774320a1a15bf18ddc9e5b572e83217.png

模型名称:指定要生成的神经网络名称。选择“自动”单选按钮后,模型名根据目标字段名自动生成,这是默认设置。如选择“定制”单选按钮,可为模型指定用户定义的模型名。

训练方式:Clementine为建立神经网络模型提供6种训练方式,如下表所示。

b1a17e445d7c1c94f6429dae735fa587.png

选择的训练方式发生变化,其“专家”选项卡选项也会发生相应的变化。

预防过度训练:选择该选项后数据随机被拆分成训练集和验证集。网络在训练集中训练,而精确度则根据验证集估计。可以在“样本%”框中指定用于训练的数据比率(数据集中的其余部分用于验证)。

设置随机数种子:如果没有设置随机数种子,则用于初始化神经网络权值的随机数序列在每次执行节点时各不相同。这样,即使神经网络设置和数据值完全一样,节点也会在各次执行生成不同的模型。选择该选项后,可以把随机数种子设置成某一具体值,这样结果模型就完全可再现。一个确定的随机数种子总是生成相同的随机数序列值,这样执行该节点总是生成同样的模型。

停止于:可以从以下终止准则中选择一个。

·默认:在这一设置下,网络将在其看起来达到最佳训练状态时停止训练。如果该设置与“多重”训练方法一起使用,训练不好的神经网络在训练过程中将被舍弃。

·精确性%:选择该选项后,训练将一直持续直到达到指定精确度。也许永远不能达到指定精确度,但是可以在任意点终止训练并保存目前达到的最高精确度。

·周期:选择该选项后,训练将持续指定的循环数(通过数据的循环数)。

·时间(分钟):选择该选项后,训练将持续到指定的时间(以分钟计算)。

为了完成目前循环,训练时间可能会略微超出指定的训练时间。

神经网络的专家项

神经网络节点专家各选项,随着所选择的训练方式的不同而发生变化。

1. 快速方式专家

快速方式专家如下图所示。一般通过“隐藏层”参数来选择神经网络的隐藏层数。更多的隐藏层可以帮助神经网络学习更为复杂的关系,同时也增加训练时间。我们还可以对每一层,指定其所包含的隐藏单元数。

98bfb3c4105f1112ed199a874f7884ca.png

2. 多重方式专家

多重方式专家如下图所示,主要设置的项为拓扑结构。一般通过“拓扑”参数指定用于训练的神经网络的拓扑结构。拓扑结构通过指定每层的隐藏单元数给出,各单元数之间用逗号隔开。使用适当的参数数目,拓扑布局可以指定1到3个隐藏层。比如,一个只有一层隐藏层,隐藏层有十个单元的网络可以指定为10;有3个隐藏层,隐藏层所含单元分别为10,12,15的网络可以指定为10,12,15。

7a68b478f9f53bc84175539ee651bb4d.png

也可以提供用空格隔开的2到3个数字来指定一层中的隐藏单元范围。如果给的是两个数字,

将创建一系列的神经网络,其包含单元数分别对应于第一个数字和第二个数字之间的各个整数(包括这两个数字)。比如,要生成每层分别含10,11,12,13和14个隐藏单元的神经网络,指定为10 14。要生成有两个隐藏层,第一个隐藏层所含隐藏单元范围为10到14,第二个隐藏层所含隐藏单元为8到12,则指定为10 14,8 12。在这种情况下,会生成包括所有可能的组合值的神经网络。如果给出第三个值,则用做第一个值到第二个值之间的增量。比如,要生成具有10,12,14,16个隐藏单元的类神经网络,指定为10162。

最后,可以提供多重网络拓扑结构,用分号隔开。比如,要分别生成只有一个隐藏层,隐藏层所含单元为10,12,14,16,以及有两个隐藏层,第一个隐藏层有10个隐藏单元,第二个隐藏层有7到10个隐藏单元的神经网络,指定为10 16 2; 10 7 10。

3. 修剪方式专家

修剪方式专家的设置如下图所示。

隐藏层:选择初始网络(修剪前)的隐藏层数。

层1,2,3:指定在初始网络(修剪前)中每一隐藏层包含隐藏单元数。初始层数应该比使用其他训练方法的层数略微大一些。

隐藏速率:指定在单个隐藏单元修剪中被剔除的隐藏单元比率数。

隐藏持续次数:指定在训练未见改进时执行的隐藏单元修剪操作次数。

输入速率:指定在单个输入单元修剪中被剔除的输入单元比率数。

输入持续次数:指定在训练未见改进时执行的输入单元修剪操作次数。

持续次数:指定在训练未见改进时,网络在尝试修剪前的训练次数。

总体持续次数:指定在训练未见改进时进行的隐藏单元修剪/输入单元修剪次数。在使用预设停止模型时,运用该选项。

47de20301335dff5e0ca197df014603b.png

4. RBFN专家设置

RBFN专家设置如下图所示。

b38f92b9ddadfcae6f67567f692a2cb9.png

RBFN聚类:指定使用的径向基函数个数或者聚类个数。这对应于隐藏层的大小。

持续次数:指定在训练未见改进时网络继续训练的次数。

RBF重叠:在RBFN中隐藏单元代表定义数据集中类别或区域的径向基函数。该参数有助于控制重叠的区域或类别。在训练中,正常情况下记录只影响距离最近的类别。通过提高这个参数,可以增加每个隐藏单元的关联区域,使记录能够影响更远的类别。此处应指定一个正实数。

欢迎大家加入人工智能圈参与交流

人工智能学习圈 - 知乎​www.zhihu.com
d72404b860228796579b1a5d9f95aa90.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值