- 博客(7)
- 收藏
- 关注
原创 从compositional到distributed,从无监督到有监督再到多任务学习 —— 漫谈句向量 Sentence Embedding
关于词向量,word embedding,研究相对较早,存在多种表征方式,目前 distributed 方式相对成熟,得到了广泛应用。但从 word 向 sentence、paragraph、document扩展,却仍处于探索阶段,本文尝试对目前主要的研究方向和代表工作进行概述,不会详细介绍模型细节,后续可能有文章继续跟进。...
2018-05-27 21:30:03 4234
原创 学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点
Ranking 是信息检索领域的基本问题,也是搜索引擎背后的重要组成模块。本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理,包括 pointwise、pairwise、listwise 三大类型,它们的经典模型,解决了什么问题,仍存在什么缺陷。关于具体应用,可能会在下一篇文章介绍,包括在 QA 领域的实践情况。
2018-05-20 14:32:26 65857 8
原创 TensorFlow-Hub 安装及使用
Tensorflow-hub 是 google 提供的机器学习模组打包函式库,帮开发者把TensorFlow的训练模型发布成模组,方便再次使用或是与社交共享。 打包用来发布机器学习中可重复使用的部分,包括TensorFlow_Graph、权重以及外部档案等所需资源。这些模组包含了大量资料集预训练后取得的变量,可以供类似任务使用。这样的成果可以使后续开发者,用更少的资料集训练精准模型、改进泛化或是...
2018-05-27 15:48:11 22175 15
原创 排序算法的原理、实现、优缺点
这里的排序算法指内部排序算法,即对内存中的数据进行排序。1 概述排序算法大体可分为两种:比较排序 时间复杂度 O(nlogn) ~ O(n^2),主要有:冒泡排序,选择排序,插入排序,归并排序,堆排序,快速排序等。非比较排序 当数据本身包含了定位特征时,才能不通过比较来确定元素的位置。时间复杂度可以达到O(n),主要有:计数排序,基数排序,桶排序等。选择排序算法,需要
2018-05-12 20:02:15 4037
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人