deep learning(深度学习)介绍

最新推荐文章于 2021-08-04 09:52:17 发布

hxxiaopei

最新推荐文章于 2021-08-04 09:52:17 发布

阅读量9.5k

点赞数

分类专栏：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hxxiaopei/article/details/18226043

版权

自然语言处理专栏收录该内容

11 篇文章 0 订阅

订阅专栏

最近接触deep learning，看了一些论文，理论细节比如RBM等，还需要研究，先通过比较通俗的语言组织下。

deep learning 并非一种具体的机器学习model，而是一个框架，或者思路。dp用于特征学习，或者特征表示。

接触到的svn lg 等机器学习算法，都会有特征提取以及特征选择，这两个决定了模型的质量，靠谱的特征越多，模型的表达能力越强，但是特征抽取受限于使用模型的人以及刻画特征的能力。无论是文本分类，还是图片以图识图等，人能够理解图片/文本，很方便的进行分类等，但是无法提取出让计算机也能够明白特征，无法把自己的理解复制到计算机上面，这就是dp要解决的问题(当然不是万能的)：特征表示，从样本中，从样本数据中提取出来最能够表示样本的特征，最理想的是人理解意义上的特征。

和BP的区别：

BP神经网络也是干了这个事情，但是BP有大问题：

1.需要标注数据，这就制约训练，大多数数据是没有label的

2.训练时间长，多个隐层更为明显，我理解是bp是通过误差逆传播的方法来更新参数，层数多时，从输出到多个隐层，损失过大

3.过拟合/局部最优，这个貌似很多模型都有可能，不管

deep learning解决了上面问题，使用dp 分成了两个部分：

1.特征表示，top 的隐层为输入的特征，等价于人提取的特征，只不过这是自动提出的，收益在于一组模型参数W

2.问题模型：如果是分类，则提供一批lable数据，通过#1提出特征，将<特征，lable>作为输入，使用svm、logistic reg等模型，解决即可。

训练手段：

deep learning的重点在于如何快速的训练模型，bp是一次迭代，优化所有层参数，dp是每次训练一层，训练完毕后，该层的输出作为下一层的输入，依次训练。关键是从layer(i-1)到layer(i)采用什么样的模型进行刻画，sigmod，tan，BM等均可，不同的模型，参数求解的方法不同。

1.autoencoder/autodecoder, 顾名思义，把输入encode层输出，再把输出decode，原则上应该和输入完全一样，优化模型让其误差最小，layer(i-1)->layer(i)->layer(i-1)' , MIN(||layer(i-1)-layer(i-1)'||)

2.RBM，layer(i-1)->layer(i)->layer(i-1)'->layer(i)'

还有一些其他的，慢慢研究。

dp的目的是抽取特征，是特征表示，不是什么分类模型。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
deep learning(深度学习)介绍

最近接触deep learning，看了一些论文，理论细节比如RBM等，还需要研究，先通过比较通俗的语言组织下。deep learning 并非一种具体的机器学习model，而是一个框架，或者思路。dp用于特征学习，或者特征表示。接触到的svn lg 等机器学习算法，都会有特征提取以及特征选择，这两个决定了模型的质量，靠谱的特征越多，模型的表达能力越强，但是特征抽取受限于使用模型的
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。