python
文章平均质量分 75
metalhjl
这个作者很懒,什么都没留下…
展开
-
Noisy Channel Model & Viterbi算法
给定一个英文语料库,里面有很多句子,已经做好了分词,/前面的是词,后面的表示该词的词性并且每句话由句号分隔,如下图所示对于一个句子S,句子中每个词语标注了对应的词性。现在的问题是,再给定一个句子S‘,生成每个词的词性确定参数最终的概率函数中包含三个可变参数,下面分别解释其含义tag2id, id2tag = {}, {} # tag2id: {"VB":0,...}, id2tag: {0:"VB",...}word2id, id2word = {}, {}.原创 2021-04-01 11:12:32 · 153 阅读 · 0 评论 -
DeepMCP 网络介绍与源码浅析
文章信息 论文标题: Representation Learning-Assisted Click-Through Rate Prediction 论文地址: https://www.ijcai.org/Proceedings/2019/0634.pdf 代码地址: https://github.com/oywtece/deepmcp 发表时间: IJCAI, 2019 论文作者: Ouyang, Wentao and Zhang, Xiuwu and Ren,原创 2021-03-13 23:54:07 · 410 阅读 · 0 评论 -
DGL-KE:亚马逊开源知识图谱嵌入库
这个库的开源已经是去年(2020)的事情了,突然感觉时间好快~,当时并没有在意,最近关注到这个库是因为自己在训练知识图谱 Embedding 的时候做的一些调研,考虑到后续大规模知识图谱的训练,需要更快的开源库,于是DGL-KE 重新回到我的视野!结论就是速度是很快的啊!!!我之前用的清华开源库 OpenKE,所以我将两者速度做了一个对比,下表是 TransE 的对比结果,训练数据的规模是10w+的数据。开源库 时间 迭代次数 OpenKE 1小时 1000 .原创 2021-03-12 16:22:46 · 1663 阅读 · 9 评论