机器学习之神经网络

最新推荐文章于 2024-03-04 12:22:57 发布

数据科学家corten

最新推荐文章于 2024-03-04 12:22:57 发布

阅读量218

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37634812/article/details/78718375

版权

机器学习专栏收录该内容

38 篇文章 2 订阅

订阅专栏

1. 背景:

1.1 以人脑中的神经网络为启发，历史上出现过很多不同版本

1.2 最著名的算法是1980年的 backpropagation

2. 多层向前神经网络(Multilayer Feed-Forward Neural Network)

2.1 Backpropagation被使用在多层向前神经网络上

2.2 多层向前神经网络由以下部分组成：

输入层(input layer), 隐藏层 (hidden layers), 输入层 (output layers)

2.3 每层由单元(units)组成

2.4 输入层(input layer)是由训练集的实例特征向量传入

2.5 经过连接结点的权重(weight)传入下一层，一层的输出是下一层的输入

2.6 隐藏层的个数可以是任意的，输入层有一层，输出层有一层

2.7 每个单元(unit)也可以被称作神经结点，根据生物学来源定义

2.8 以上成为2层的神经网络（输入层不算）

2.8 一层中加权的求和，然后根据非线性方程转化输出

2.9 作为多层向前神经网络，理论上，如果有足够多的隐藏层(hidden layers) 和足够大的训练集, 可以模

拟出任何方程

3. 设计神经网络结构

3.1 使用神经网络训练数据之前，必须确定神经网络的层数，以及每层单元的个数

3.2 特征向量在被传入输入层时通常被先标准化(normalize）到0和1之间（为了加速学习过程）

3.3 离散型变量可以被编码成每一个输入单元对应一个特征值可能赋的值

比如：特征值A可能取三个值（a0, a1, a2), 可以使用3个输入单元来代表A。

如果A=a0, 那么代表a0的单元值就取1, 其他取0；

如果A=a1, 那么代表a1de单元值就取1，其他取0，以此类推

3.4 神经网络即可以用来做分类(classification）问题，也可以解决回归(regression)问题

3.4.1 对于分类问题，如果是2类，可以用一个输出单元表示（0和1分别代表2类）

如果多余2类，每一个类别用一个输出单元表示

所以输入层的单元数量通常等于类别的数量

3.4.2 没有明确的规则来设计最好有多少个隐藏层

3.4.2.1 根据实验测试和误差，以及准确度来实验并改进

4. 交叉验证方法(Cross-Validation)

K-fold cross validation

5. Backpropagation算法

5.1 通过迭代性的来处理训练集中的实例

5.2 对比经过神经网络后输入层预测值(predicted value)与真实值(target value)之间

5.3 反方向（从输出层=>隐藏层=>输入层）来以最小化误差(error)来更新每个连接的权重(weight)

5.4 算法详细介绍

输入：D：数据集，l 学习率(learning rate)，一个多层前向神经网络

输入：一个训练好的神经网络(a trained neural network)

5.4.1 初始化权重(weights)和偏向(bias): 随机初始化在-1到1之间，或者-0.5到0.5之间，每个单元有

一个偏向

5.4.2 对于每一个训练实例X，执行以下步骤：

5.4.2.1：由输入层向前传送

5.4.2.2 根据误差(error)反向传送

对于输出层：

对于隐藏层：

权重更新：

偏向更新

5.4.3 终止条件

5.4.3.1 权重的更新低于某个阈值

5.4.3.2 预测的错误率低于某个阈值

5.4.3.3 达到预设一定的循环次数

6. Backpropagation 算法举例

对于输出层：

对于隐藏层：

权重更新：

偏向更新

1. 关于非线性转化方程(non-linear transformation function)

sigmoid函数(S 曲线)用来作为activation function:

1.1 双曲函数(tanh)

1.2 逻辑函数(logistic function)

2. 手写数字识别：

每个图片8x8

识别数字：0,1,2,3,4,5,6,7,8,9

Code:

import numpy as np

from sklearn.datasets import load_digits #倒入数据集

from sklearn.metrics import confusion_matrix, classification_report #分类效果的评分

from sklearn.preprocessing import LabelBinarizer 将y的数据结果标准化，相当于热编码

from NeuralNetwork import NeuralNetwork

from sklearn.cross_validation import train_test_split

digits = load_digits()

X = digits.data

y = digits.target

X -= X.min() # normalize the values to bring them into the range 0-1

X /= X.max()

nn = NeuralNetwork([64,100,10],'logistic') #8*8 的像素所有输入为64 隐藏性为100 输出层为0～9 10个输出结果

X_train, X_test, y_train, y_test = train_test_split(X, y) #简单的划分训练集和测试集

labels_train = LabelBinarizer().fit_transform(y_train) #将输出标准化

labels_test = LabelBinarizer().fit_transform(y_test)

print "start fitting"

nn.fit(X_train,labels_train,epochs=3000) #调用神经网络模型，训练3000次

predictions = []

for i in range(X_test.shape[0]): #shape【0】单行数据进行递归

o = nn.predict(X_test[i] ) 将训练的最大准确的分类结果加入训练结果列表

predictions.append(np.argmax(o))

print confusion_matrix(y_test,predictions) 对训练结果与世纪对比评分

print classification_report(y_test,predictions)

数据科学家corten

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之神经网络

1. 背景: 1.1 以人脑中的神经网络为启发，历史上出现过很多不同版本 1.2 最著名的算法是1980年的 backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Backpropagation被使用在多层向前神经网络上 2.2 多层向前神经网络由以
复制链接

扫一扫

专栏目录

数据科学家corten CSDN认证博客专家 CSDN认证企业博客

码龄7年

103: 原创

73万+: 周排名

144万+: 总排名

18万+: 访问

: 等级

2658: 积分

104: 粉丝

43: 获赞

11: 评论

265: 收藏

私信

关注

热门文章

分类专栏

http 5篇
python 30篇
爬虫 24篇
算法与数据结构 5篇
机器学习 38篇
闲聊 1篇
区块链
量化分析 2篇

最新评论

2018的第一篇博客，总结下半年来的变化吧
ztjtrace: 我也是转行做IT，像你学习
python模块（APScheduler定时任务）
迷失的蓝色小恐龙: 作者我想问个问题，我如果想定时调用一个异步函数（要加async的那种），那么我改如何写呢？我的await应该加在哪里呀？[code=python] from apscheduler.schedulers.blocking import BlockingScheduler from datetime import datetime async def my_clock(): print("Hello! The time is:%s" % datetime.now()) async def job(): await my_clock() if __name__ == '__main__': scheduler = BlockingScheduler() scheduler.add_job(job, "interval", seconds=3) scheduler.start() [/code]这个代码是报错的，就是说异步函数没有用await修饰。
python 与自然语言处理之语言模型n-gram
骑熊喊乌拉: 博主可以把文章里的图再补充一下吗？每个图都看不到啊，文字看着很好，很有道理，但是没有图还是没办法深入了解。
爬虫知识点（scrapy_redis分布式爬虫系统）
鬼画符_S1: 您好请问几个问题首先 1、当scrapy应用上scrapy_redis组件后，加入部署了20台机器，但是有一天期中几台机器有问题，需要将子爬虫停止下来，当我将子爬虫使用安全方式停止下来，是否会对整个爬虫系统有影响，2、当我某一天想把这几个子爬虫再启动起来，是否会对整体爬虫系统有影响 3、假如，目前有20台分布式爬虫机器在跑着同一套程序，但是爬取速度还是不够快，现在准备新加十台机器，以增快爬取速度，是否直接可以将爬虫代码部署在这十台机器上直接启动，便可以，有没有什么需要注意的，还是这么做存在着什么风险。
机器学习与神经网络
宽客在线: 《神经网络与机器学习（原书第3版）》本书的可读性非常强，作者举重若轻地对神经网络的基本模型和主要学习理论进行了深入探讨和分析，通过大量的试验报告、例题和习题来帮助读者更好地学习神经网络。附上书籍下载链接：https://quant.la/Download/View/1287/

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。