自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 论文阅读:WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations

标题 :WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations 0 摘要 1 概述 2 word-in-context数据集 2.1 构建 2.1.1 编撰 2.1.2 修改 2.2 质检 2.3 统计 3 实验 3.1 结果 4 相关工作 5 结论 ...

2021-03-16 22:24:25 615

原创 论文阅读:Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings

目录 个人论文阅读:Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings 0 摘要 1 介绍 2 相关工作 3 背景知识 4 EWISE 5 实验设置 6 评估 7 结论和未来工作 个人论文阅读:Zero-shot Word Sense Disambiguation using Sense Defifinition Embeddings 0 摘要 1 介绍 2 相关工作 3 背景知识 .

2021-03-04 17:26:23 394

原创 基于深度学习的自然语言处理--笔记(第九章)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。 提示:以下是本篇文章正文内容,下面案例可供参考 一、pandas是什么? 示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 二、使用步骤 1.引入库 代码

2020-08-31 18:52:12 224

原创 基于深度学习的自然语言处理--笔记(第八章)

第8章 从文本特征到输入 文章目录前言8.1 编码分类特征8.1.1 独热编码8.1.2 稠密编码(特征嵌入)8.1.3 稠密向量与独热表示8.2 组合稠密向量8.2.1 基于窗口的特征8.2.2 可变特征数目:连续词袋8.3 独热和稠密向量间的关系8.4 杂项8.4.3 特征组合8.4.4 向量共享8.4.5 维度 前言 本章将讨论如何将一系列核心特征转换成分类器可接收的特征向量的细节。 8.1 编码分类特征 处理自然语言时用到的大部分特征是离散、分类特征,比如单词、字母和词性。我如何将这样的分

2020-08-30 21:14:55 348

原创 基于深度学习的自然语言处理--笔记(第七章)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。 提示:以下是本篇文章正文内容,下面案例可供参考 一、pandas是什么? 示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 二、使用步骤 1.引入库 代码

2020-08-30 17:13:40 239

原创 基于深度学习的自然语言处理--笔记(第六章)

第6章 文本特征构造 文章目录前言6.1 NLP分类问题中的拓扑结构二、使用步骤1.引入库2.读入数据总结 前言 这种从文本数据到具体向量的映射称为“特征提取”和“特征表示”,通过“特征方程”所完成 。 决定正确的特征是使一个机器学习项目取得成功的一部分。深度神经网络减轻了对特征工程的需要,当然,核心特征还是要被定义的。尤其是对语言数据,其以一系列离散的符号形式存在,这个序列需要使用微妙的方法转换成为一个数值向量。 6.1 NLP分类问题中的拓扑结构 词 我们面对的都是词(word),例如"dog",

2020-08-28 17:49:05 267

原创 基于深度学习的自然语言处理--笔记(第五章)

第五章 神经网络训练 文章目录前言5.1计算图二、使用步骤1.引入库2.读入数据总结 前言 与线性模型类似,神经网络也是可微分的参数化函数,它使用了基于梯度的优化方法来进行训练,非线性神经网络的目标函数并不是凸函数,因此使用基于梯度的优化方法,可能会陷入局部极小。但是,基于梯度的优化方法在实际应用中仍然取得了良好的效果。 ***梯度计算是神经网络训练的核心*** 提示:以下是本篇文章正文内容,下面案例可供参考 5.1计算图 计算图是任意数学表达式的一种图表达结构。 它是一个有向无环图 (DAG),

2020-08-27 17:47:58 228

原创 基于深度学习的自然语言处理--笔记(第四章)

@[TOC]第4章 前馈神经网络 4.2 数学表示 最简单的神经网络称作感知器。它是一个简单的线性模型: 其中,WWW是权重矩阵,bbb是偏置项。为了能超越线性函数,我们引进一个非线性的隐藏层,这样就能得到带有单一隐层的多层感知器(MLP1)。 ggg是作用于每个元素的非线性方程(也称作激活函数或非线性),ggg在网络表示复杂函数的能力中,起了至关重要作用。没有ggg的非线性,神经网络只能表示输入的线性变换。例如: 由线性变换产生的向量成为层,或者称完全连接的或仿射的。具有多个隐层的网络称深层网络。 与线

2020-08-26 18:31:32 157

原创 基于深度学习的自然语言处理--笔记(第三章)

@[TOC]第三章 从线性模型到多层感知器 3.1线性模型局限性 线性(对数-线性)模型的假设严格受限。必如异或问题就不能解决。 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200826114644445.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyNjIzMzI4,size_16,c..

2020-08-26 15:37:00 109

原创 基于深度学习的自然语言处理--笔记(第二章)

@第二章 有监督分类与前馈神经网络 训练方法 留一法:在训练过程中,我们必须评估己训练函数在未见实例上的准确率。一种方法是进行留 一交叉验证 (leave one out cross validation ):训练k个函数 f ,每次取出1个不同的输入样例 x,评价得到的函数f() 的预测能力。 留存集:就计算时间而言,一个更有效的方法是划分训练集为两个子集,可以按80 %/ 20 %划分,在较大的子集(训练集)上训练模型,在较小的子集(留存集, held-out set )上测试模型的准确率。 三路划

2020-08-23 21:32:16 227

原创 基于深度学习的自然语言处理--笔记(第一章)

@第一章 引言 1.1 自然语言处理的挑战 使用计算机理解和产生语言极具挑战性。最为人知的处理语言数据的方法是使用有监督机器学习(supervised machine learning)算法,其试图从事先标注好的输入/输出集和中推导出使用的模式和规则。机器学习方法擅长那些很难获得规则集,但是相对容易获得给定输入及相应输出样本的领域 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客: 全新的界面设计 ,将会带

2020-08-23 15:25:53 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除