- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 练习题 - 基于快速文本标题匹配的知识问答实现(二,实现篇)
承接练习题 - 基于快速文本标题匹配的知识问答实现(一,基础篇),前篇主要把qdr这个项目解剖了一下,现在开始应用做一下问答。 可以看到qdr这个项目的特点是:可以快速比对两个文本之间的相似性,而且计算tfidf、bm25、lm三款模型的速度很快。 那么本轮知识问答的设计源于此:先储备一批问答语料,一问一答比较合适;把问题进行分词,变为文本序列;载入qdr模型之中,进行训练; 先t...
2018-08-30 22:30:19 1303 1
原创 练习题 - 基于快速文本标题匹配的知识问答实现(一,基础篇)
该练习题来的很蹊跷,笔者在看entity embeddings的东西,于是看到了16年的这篇文章:Learning Query and Document Relevance from a Web-scale Click Graph,想试试效果,就搜到了qdr这个项目,然后试了试,虽然entity embeddings做的不好,但是好像可以依据里面的文本匹配搞搞问答,于是花了一点时间,因为是c...
2018-08-30 21:31:49 1388 2
原创 流水账︱Elmo词向量中文训练过程杂记
1 elmo是什么?参考:《文本嵌入的经典模型与最新进展》 人们已经提出了大量可能的词嵌入方法。最常用的模型是 word2vec 和 GloVe,它们都是基于分布假设的无监督学习方法(在相同上下文中的单词往往具有相似的含义)。虽然有些人通过结合语义或句法知识的有监督来增强这些无监督的方法,但纯粹的无监督方法在 2017-2018 中发展非常有趣,最著名的是 FastText(word2v...
2018-08-21 22:53:21 24731 13
原创 pyecharts︱交互式pyecharts的相关使用教程
pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库。用 Echarts 生成的图可视化效果非常棒,为了与 Python 进行对接,方便在 Python 中直接使用数据生成图,我写了这个项目。以下是最新版echart的靓图。当然,pyecharts貌似没有这么齐全。 官方文档:http://pyecharts.herokuap............
2018-08-07 22:38:50 15043
Rstudio Server + Docker + tensorflowR的dockerfile文件
2018-09-28
word2vec自编译函数(By Jian Li,2014-09-21)
2016-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人