以牺牲自由为代价的自由-CSDN博客

原创论文阅读：WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations

标题：WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations 0 摘要1 概述2 word-in-context数据集2.1 构建2.1.1 编撰2.1.2 修改2.2 质检2.3 统计3 实验3.1 结果4 相关工作5 结论...

2021-03-16 22:24:25 876

原创论文阅读：Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings

目录个人论文阅读：Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings0 摘要1 介绍2 相关工作3 背景知识4 EWISE5 实验设置6 评估7 结论和未来工作个人论文阅读：Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings0 摘要1 介绍2 相关工作3 背景知识.

2021-03-04 17:26:23 609

原创基于深度学习的自然语言处理--笔记（第九章）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码

2020-08-31 18:52:12 335

原创基于深度学习的自然语言处理--笔记（第八章）

第8章从文本特征到输入文章目录前言8.1 编码分类特征8.1.1 独热编码8.1.2 稠密编码（特征嵌入）8.1.3 稠密向量与独热表示8.2 组合稠密向量8.2.1 基于窗口的特征8.2.2 可变特征数目：连续词袋8.3 独热和稠密向量间的关系8.4 杂项8.4.3 特征组合8.4.4 向量共享8.4.5 维度前言本章将讨论如何将一系列核心特征转换成分类器可接收的特征向量的细节。8.1 编码分类特征处理自然语言时用到的大部分特征是离散、分类特征，比如单词、字母和词性。我如何将这样的分

2020-08-30 21:14:55 399

原创基于深度学习的自然语言处理--笔记（第七章）

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码

2020-08-30 17:13:40 342

原创基于深度学习的自然语言处理--笔记（第六章）

第6章文本特征构造文章目录前言6.1 NLP分类问题中的拓扑结构二、使用步骤1.引入库2.读入数据总结前言这种从文本数据到具体向量的映射称为“特征提取”和“特征表示”，通过“特征方程”所完成。决定正确的特征是使一个机器学习项目取得成功的一部分。深度神经网络减轻了对特征工程的需要，当然，核心特征还是要被定义的。尤其是对语言数据，其以一系列离散的符号形式存在，这个序列需要使用微妙的方法转换成为一个数值向量。6.1 NLP分类问题中的拓扑结构词我们面对的都是词(word)，例如"dog",

2020-08-28 17:49:05 445

原创基于深度学习的自然语言处理--笔记（第五章）

第五章神经网络训练文章目录前言5.1计算图二、使用步骤1.引入库2.读入数据总结前言与线性模型类似，神经网络也是可微分的参数化函数，它使用了基于梯度的优化方法来进行训练，非线性神经网络的目标函数并不是凸函数，因此使用基于梯度的优化方法，可能会陷入局部极小。但是，基于梯度的优化方法在实际应用中仍然取得了良好的效果。***梯度计算是神经网络训练的核心***提示：以下是本篇文章正文内容，下面案例可供参考5.1计算图计算图是任意数学表达式的一种图表达结构。它是一个有向无环图 (DAG），

2020-08-27 17:47:58 344

原创基于深度学习的自然语言处理--笔记（第四章）

@[TOC]第4章前馈神经网络4.2 数学表示最简单的神经网络称作感知器。它是一个简单的线性模型：其中，WWW是权重矩阵，bbb是偏置项。为了能超越线性函数，我们引进一个非线性的隐藏层，这样就能得到带有单一隐层的多层感知器（MLP1）。ggg是作用于每个元素的非线性方程（也称作激活函数或非线性），ggg在网络表示复杂函数的能力中，起了至关重要作用。没有ggg的非线性，神经网络只能表示输入的线性变换。例如：由线性变换产生的向量成为层，或者称完全连接的或仿射的。具有多个隐层的网络称深层网络。与线

2020-08-26 18:31:32 192

原创基于深度学习的自然语言处理--笔记（第三章）

@[TOC]第三章从线性模型到多层感知器3.1线性模型局限性线性（对数-线性）模型的假设严格受限。必如异或问题就不能解决。![在这里插入图片描述](https://img-blog.csdnimg.cn/20200826114644445.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyNjIzMzI4,size_16,c..

2020-08-26 15:37:00 146

原创基于深度学习的自然语言处理--笔记（第二章）

@第二章有监督分类与前馈神经网络训练方法留一法：在训练过程中，我们必须评估己训练函数在未见实例上的准确率。一种方法是进行留一交叉验证（leave one out cross validation ）：训练k个函数 f ，每次取出1个不同的输入样例 x，评价得到的函数f() 的预测能力。留存集：就计算时间而言，一个更有效的方法是划分训练集为两个子集，可以按80 %/ 20 %划分，在较大的子集（训练集）上训练模型，在较小的子集（留存集， held-out set ）上测试模型的准确率。三路划

2020-08-23 21:32:16 312

原创基于深度学习的自然语言处理--笔记（第一章）

@第一章引言1.1 自然语言处理的挑战使用计算机理解和产生语言极具挑战性。最为人知的处理语言数据的方法是使用有监督机器学习（supervised machine learning）算法，其试图从事先标注好的输入/输出集和中推导出使用的模式和规则。机器学习方法擅长那些很难获得规则集，但是相对容易获得给定输入及相应输出样本的领域新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计，将会带

2020-08-23 15:25:53 324