自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (3)
  • 收藏
  • 关注

原创 自然语言处理期末复习(3)-(5)模型与句法分析

第三部分 隐马尔科夫模型与词类标注1.定义:如果给定一个观察序列(不同颜色的小球序列),不能直接确定状态转换序列(坛子的序列),因为状态转移过程被隐藏起来了。所以这类随机过程被称为隐马尔科夫过程。 2.词类标注的方法:(1)基于规则的词类标注:查字典,给词标记所有可能,逐步删除错误的可能(2)基于隐马尔科夫模型的词类标注:词代表小球,标注代表坛子,相当于给了小球,求坛子(3)改进隐马尔科夫模型:b...

2018-06-20 00:17:46 2537 6

原创 自然语言处理期末复习(6)话题模型

一、LAS1.向量空间模型通过计算文档向量间的相似度来衡量两个文档之间的相关性,常用的相似度为(夹角)余弦相似度。2.LSA的核心在于将秩r的词项-文档矩阵C进行SVD分解,并寻求词项-文档矩阵的k秩逼近Ck 此时我们可以说,在进行潜在语义分析之前,文档被隐含表示成r维空间中的向量,而在潜在语义分析之后,文档被表示为k维空间中的向量,也就是潜在语义空间中的向量,向量的维数缩减为k维。维数k可以被解...

2018-06-19 09:29:39 1346

原创 自然语言处理期末复习(7)平行文本与机器翻译

一、平行文本的自动对齐1.按照语料库所涉语种,语料库可区分为(1)单语语料库 (2)多语语料库: 由多语平行文本组成2.双语对齐处理在两种语言文本的不同语言单位之间建立对应关系,确定源语言文本中哪个(些)语言单位和目标语言文本中哪个(些)语言单位互有翻译关系。3. 自动双语对齐处理指的是通过一定的算法,由计算机在双语文本间建立对齐关系。二、双语句子级对齐1.概念:在双语文本间建立句子一级的对齐关系...

2018-06-18 21:58:43 2349

原创 自然语言处理期末复习(2)中文分词

1.汉语分词:通过计算机程序把组成汉语文本的字串自动转换为词串的过程被称为自动切分2.汉语切分的原因:(1)语音的合成(2)信息检索(3)词语计量分析3.汉语分词基本方法:(1)基于词表的方法(2)字序列标记方法4.最大匹配法:(1)  正向最大匹配法(MM) 从左向右匹配词表(2)  逆向最大匹配法(RMM) 从右向左匹配词表5.歧义的类型(1)交集型歧义:AJ/B、A/JB交集型歧义字段中交集...

2018-06-17 20:40:55 1907 2

原创 自然语言处理期末复习(1)n元模型

一、n元模型1.语言建模:根据给定的语言样本估计概率P(s)的过程2.语言模型:根据语言样本估计出的概率分布P称为语言L的语言模型。3.马尔科夫假设:词wi 的出现只与其前n-1个词有关4.n元组(n-gram):只需要考虑n个词组成的片段。(n越大,模型需要的参数越多,历史信息越多,模型越准确)5.如何建立n元模型:确定训练语料、对预料进行分词、句子边界标记,增加两个特殊词。建立n元模型的方法:...

2018-06-17 19:35:09 2942

原创 A Knowledge-Grounded Neural Conversation Model 翻译

A Knowledge-Grounded Neural Conversation ModelAbstract Neural network models arecapable of generating extremely natural sounding conversational interactions.Nevertheless, these models have yet to demo...

2018-06-14 11:36:41 1164 2

原创 百练OJ:2388:寻找中位数

描述在N(1<=N<10,000且N为奇数)个数中,找到中位数。输入第1行:N第2至N+1行:每行是一个整数输出第一行:中位数样例输入524135样例输出3解题代码:import java.util.Arrays;import java.util.Scanner;public class Main{ public static void main(String[] ...

2018-06-05 22:55:58 1153 2

自动完形填空系统构建-基于n元模型构建的朴素系统

在语义连贯的句子中去掉一个词语,形成空格,要求在给出的对应备选答案中,系统自动选出一个最佳的答案,使语句恢复完整。 该项目基于python2.7 需要import nltk 在项目中包含了部分训练语料需要自行丰富 需要全部训练语料的请留下邮箱

2018-06-27

送女友的礼物源码详情见博客

以一个视频的方式呈现对女友的节日祝福,index.html中的javascript 中包含了第一页的密码。如有问题欢迎留言【https://blog.csdn.net/Kangyucheng/article/details/79380992】

2018-02-26

编译原理词法分析器JAVA实现

编译原理词法分析器,可识别所有java关键字,并采用图形化实现,解压之后可查看代码,总共四个类。

2015-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除