- 博客(3)
- 收藏
- 关注
原创 隐马尔科夫
隐马尔科夫(HMM)简介隐马尔科夫可以用于序列标注问题,比如分词过程,假设分词按照BEOS过程,在这里,隐马尔科夫就是从隐马尔科夫模型生成隐藏状态序列基本参数初始概率向量π:就是我一开始分别是B、E、O、S的概率如{”B“:0.6,“S”:0.4}状态转移概率A:就是我从其中一个隐状态到达另一个隐藏状态的概率,如:当前为B,则下一个字符是E的概率是0.8观测概率矩阵B:就是...
2019-01-31 13:43:02 365
原创 Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Network
标签(空格分隔): 自然语言处理简介在简单的神经网络上就能达到较好的效果即使不用神经网络,也能达到较好的效果相关工作一开始的时候人们会把简单问句简化成一个结构化的问句最近的一个数据集已经成为了知识图谱上的问答基线本文并不认为人们已经充分探索了baseline方法论本文将QA问题分为四个部分:实体识别、实体链接、关系预测、证据整合github:https://g...
2019-01-08 10:55:02 562 2
原创 最大频率分词的一些测试结果
基于动态规划的最大频率分词写在前面基于动态规划的最大频率分词是一种比较简单的分词方法,jieba分词就用了这种分词方法(当然还有HMM)博主对该分词方法做了一下简单的测试测试数据集选的是微软的分词测试集和清华的分词测试集两个测试集都有一定的训练数据和测试数据基本情况如下:数据集训练集数量测试集数量微软869243985清华19056194...
2019-01-06 16:38:23 416
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人