2.10 自然语言处理 NLP
文章平均质量分 80
CongyingWang
咸鱼太闲
展开
-
论文笔记&翻译——Enhanced LSTM for Natural Language Inference(ESIM)
文章目录0.前言1. 模型结构1.1 input encoding1.2 local inference modeling1.3 inference composition2. 模型实现0.前言在Query 扩召回项目中,通过各种手段挖掘出一批同义词,想对其进行流程化,所以考虑加上语义推断,在同事的推荐下使用了 EMIS 模型,据了解这个模型在近两年横扫了好多比赛,算是 NLI (Natura...原创 2018-12-13 16:29:48 · 5930 阅读 · 0 评论 -
Python实战——ESIM 模型搭建(keras版)
文章目录1. input encoding1.1 原理1.2 实现2. local inference modeling2.1 原理2.2 实现3. inference composition3.1 原理3.2 实现EMIS 原理笔记见:论文笔记&翻译——Enhanced LSTM for Natural Language Inference(ESIM)ESIM主要分为三部分:inpu...原创 2018-12-13 16:36:47 · 8596 阅读 · 14 评论 -
python函数——目录
python函数——目录Python函数——Numpy size()python函数——字典get()方法python函数——字典设置默认值 setdefault()python函数——字典设置默认值get() 与 setdefault()区别...原创 2018-12-07 13:22:13 · 5207 阅读 · 1 评论 -
python函数——Keras分词器Tokenizer
文章目录0. 前言python函数 系列目录:python函数——目录0. 前言原创 2018-12-11 16:16:57 · 21324 阅读 · 1 评论 -
python函数——序列预处理pad_sequences()序列填充
文章目录0. 前言1. 语法1.1 参数说明1.2 返回值2. 实例python函数 系列目录:python函数——目录0. 前言为了实现的简便,keras只能接受长度相同的序列输入。因此如果目前序列长度参差不齐,这时需要使用pad_sequences()。该函数是将序列转化为经过填充以后的一个长度相同的新序列新序列。1. 语法官方语法如下1:Code.1.1 pad_sequen...原创 2018-12-11 16:46:32 · 65474 阅读 · 4 评论 -
文本相似度——编辑距离
文章目录1 基本思路2 算法基本步骤3 算法实现3.1 递归3.2 动态规划3.3 Python 使用包文本相似度计算方法汇总:文本相似度计算方法详解1 基本思路定义:假设字符串SAS_ASA,共mmm 位,即 SA[1]S_A[1]SA[1] 至 SB[m]S_B[m]SB[m]字符串 SBS_BSB,共nnn位,即SB[1]S_B[1]SB[1]至SB[n]S_B[...原创 2019-04-22 19:29:28 · 2029 阅读 · 0 评论 -
文本相似度——汉明距离
文章目录1 基本思路2 算法实现2.1 Python 实现2.2 Python 包文本相似度计算方法汇总:文本相似度计算方法详解1 基本思路汉明距离定义:在信息论中,两个等长字符串之间的汉明距离(英语:Hamming distance)是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。1示例:1011101与1001001之...原创 2019-04-25 17:41:27 · 2808 阅读 · 0 评论