自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 隐马尔科夫

隐马尔科夫(HMM)简介隐马尔科夫可以用于序列标注问题,比如分词过程,假设分词按照BEOS过程,在这里,隐马尔科夫就是从隐马尔科夫模型生成隐藏状态序列基本参数初始概率向量π:就是我一开始分别是B、E、O、S的概率如{”B“:0.6,“S”:0.4}状态转移概率A:就是我从其中一个隐状态到达另一个隐藏状态的概率,如:当前为B,则下一个字符是E的概率是0.8观测概率矩阵B:就是...

2019-01-31 13:43:02 365

原创 Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Network

标签(空格分隔): 自然语言处理简介在简单的神经网络上就能达到较好的效果即使不用神经网络,也能达到较好的效果相关工作一开始的时候人们会把简单问句简化成一个结构化的问句最近的一个数据集已经成为了知识图谱上的问答基线本文并不认为人们已经充分探索了baseline方法论本文将QA问题分为四个部分:实体识别、实体链接、关系预测、证据整合github:https://g...

2019-01-08 10:55:02 562 2

原创 最大频率分词的一些测试结果

基于动态规划的最大频率分词写在前面基于动态规划的最大频率分词是一种比较简单的分词方法,jieba分词就用了这种分词方法(当然还有HMM)博主对该分词方法做了一下简单的测试测试数据集选的是微软的分词测试集和清华的分词测试集两个测试集都有一定的训练数据和测试数据基本情况如下:数据集训练集数量测试集数量微软869243985清华19056194...

2019-01-06 16:38:23 416

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除