(01) 第一讲 NLP(Natural Language Processing)和深度学习入门

最新推荐文章于 2023-08-24 15:44:34 发布

遨游的菜鸡

最新推荐文章于 2023-08-24 15:44:34 发布

阅读量400

点赞数

分类专栏： CS224N NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34405401/article/details/104448535

版权

CS224N NLP 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.介绍

1.1 深度学习和机器学习不同的是

大多数传统的机器学习是围绕决策树(decision trees)、逻辑回归(logistic regressions)、朴素贝叶斯(naive bayes)、支持向量机(SVM:support vector machines)等概念。它的本质是由人类仔细审视一个特定的问题，然后设计出与该问题相关的重要特征要素，在手工写代码。因此在机器学习中，是人类研究如何描述数据，总结重要特征。
深度学习是表征学习(representation learning)的一个分支,表征学习的理念是我们向电脑提供原始信号(视觉或语言)，电脑自动得出好的中介表征来完成任务，也就是说由机器定义特征。深度学习是自动得到多层学习得到的表征。现在深度学习一般指神经网络。

1.2 基于deep learning的NLP

基于深度学习的NLP的核心想法是以词义(word meaning)为起点。具体而言将表示的词用一个数字向量表示。将单词放到高维向量空间中，这些空间就是语义空间，具有相似含义的词汇在向量空间中形成聚集块。向量空间中也存在方向，表示成分和意义的信息。但由于人类不擅长解读高维空间，因此常常将它映射成二维或三维，降维过程中就会丢失一些信息，因此可能具有误导性。
降维过程中，用了一些方法来表示高维向量空间中的主要含义，比如主成分分析(PAC)、t-SNE(一种常用的非线性降维) 。
向量空间中的坐标轴的意义：目前没有特殊发现，因此是没有实际意义。

1.3 NLP的传统做法

NLP的传统方法一般是做lambda演算基于微积分的语义理论，对每个单词赋予语义函数，然后用准确算法研究如何将词汇意义结合起来，获得语义表达。

1.4 总结

用向量表示所有的语言形式，词的部分、单词、句子、对话，都将他们表示成具有真实值的向量。

遨游的菜鸡

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
(01) 第一讲 NLP(Natural Language Processing)和深度学习入门

1.介绍1.1 深度学习和机器学习不同的是大多数传统的机器学习是围绕决策树(decision trees)、逻辑回归(logistic regressions)、朴素贝叶斯(naive bayes)、支持向量机(SVM:support vector machines)等概念。它的本质是由人类仔细审视一个特定的问题，然后设计出与该问题相关的重要特征要素，在手工写代码。因此在机器学习中，是人类研究...
复制链接

扫一扫

专栏目录

遨游的菜鸡 CSDN认证博客专家 CSDN认证企业博客

码龄8年

154: 原创

24万+: 周排名

164万+: 总排名

21万+: 访问

: 等级

2565: 积分

81: 粉丝

133: 获赞

34: 评论

703: 收藏

私信

关注

热门文章

分类专栏

python 26篇
深度学习 7篇
MySQL 4篇
paper 6篇
主动学习 4篇
pytorch 14篇
杂记 16篇
机器学习 7篇
算法与数据结构 9篇
项目实训 9篇
c++ 9篇
机器学习周志华(西瓜书) 11篇
前端 4篇
requests 5篇
scrapy 5篇
CS224N NLP 5篇
统计学习方法 11篇
tensorflow 12篇
kaggle 2篇

最新评论

主动学习框架
境界面上的双曲线: 博主，我想请问一下，如果我们自己建立一个深度学习模型与主动学习器结合，在不断往训练集里面加新的数据的过程中，我们如何才能知道自己的深度学习模型里的参数才是最优的呢？因为单独使用深度学习的时候，我们会多次训练调参以尽量达到最优参数，但是与主动学习结合加新数据的过程中，我们并不知道自己的模型参数是不是最优的，如果在不断加新数据的过程中调参数的话，感觉前后查询数据的模型就变了（相同模型不同参数）
主动学习框架
境界面上的双曲线: 请问一下你知道结果了吗？回归模型是不是这些查询策略都不适用啊？
主动学习框架
fighting_!: 请问，使用modAL的时候若是回归任务就需要自己写查询策略是吗？我看modAL库下modAL.uncertainty下都是用于分类的
python 用for i in range(10)生成列表
扶桑照槛: 楼主太棒力
c++按位运算
小小神射手: 感谢博主详细分享了c++关于二进制位运算的知识，知识点讲解的非常实用，读完后刷新了我对二进制位运算的认知。这篇文章是个妥妥的干货！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。