- 博客(5)
- 资源 (6)
- 收藏
- 关注
原创 topk相似度性能比较(kd-tree、kd-ball、faiss、annoy、线性搜索)
目前对向量topk相似度计算算法有许多,如下图:关于向量取topk相似度的应用场景很多,比如推荐系统里面使用item2vec经常离线计算好topk的相似度,搜索领域里面的query2vec使用topk相似度,word2vec领域里面的topk相似度,本文选取了几个经典的算法做性能比较,kd-tree、kd-ball、faiss、线性搜索、annoy几个算法,环境都是mac本地cpu环境,向...
2018-11-19 11:18:54 13285 5
转载 NLP中语言模型预训练方法
最近,在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。就此,我将最近看的一些相关论文进行总结,选取了几个代表性模型(包括ELMo [1],OpenAI GPT [2]和BERT [3])和大家一起学习分享。1. 引言在介绍论文之前,我将先简单介绍一些相关背景知识。首先是语言模型(Language Model),语言模型简单来...
2018-11-09 13:55:50 7949 1
转载 专题-句向量(Sentence Embedding)
原始地址:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/B-%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/B-%E4%B8%93%E9%A2%98-%E5%8F%A5%E5%B5%8C%E5%85%A5.md Reference...
2018-11-08 11:00:29 15024 2
转载 短文本分类的 ResLCNN 模型
发现一个有意思的模型,也是利用何凯明残差网络的思想,具体网络结构可以看下: 作者看了下各种实验结果: 原始地址:https://blog.csdn.net/gentelyang/article/details/80840585?utm_source=blogxgwz9...
2018-11-07 10:00:06 1986
转载 大规模中文概念图谱CN-Probase正式发布
历时多年的研发,复旦大学知识工场实验室正式推出大规模中文概念图谱——CN-Probase,用于帮助机器更好的理解人类语言。概念图谱中包含实体(比如“刘德华”)、概念(比如“演员”),实体与概念之间的类属关系(又称isA关系,比如 “刘德华 isA 演员”),概念与概念之间的 subclass of 关系(比如 “电影演员”是“演员”的子类)。通常后面两类关系,又统称为 isA 关系。如果 A is...
2018-11-05 19:32:54 393
Python xgboost windows下安装包(64位,Python3.5包)
2017-02-22
python安装神器easy_install
2015-08-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人