机器学习
文章平均质量分 84
理想主义帕鲁
“你灵魂深处,总要有这样一个地方:永远在海面漂荡,在半空中飞扬;永远轻盈、永远滚烫,不愿下沉、不肯下降。”
展开
-
支付宝AR扫福背后的故事
马上要到二零二一年的农历新年了,在这里首先祝小伙伴们新年快乐。与往年除夕一样,支付宝提供了集五福、分红包的活动,以庆祝新年的到来。其中,AR扫福的部分是与计算机视觉技术紧密相关的,而它背后的技术也十分令人感兴趣。本文在这里对AR扫福相关的信息和技术进行了汇总,以期望对其他部署于移动端的深度学习系统的落地实践起到借鉴意义。本文的部分内容转载于网络,其版权归原作者所有。转载 2021-02-10 22:19:11 · 2453 阅读 · 0 评论 -
使用图神经网络(Graph Neural Network)学习特征表达
在现实世界的许多应用当中,很多数据集都天然的带有某种图结构信息,例如社交网络、万维网、知识网络、蛋白质分子结构和论文互相引用形成的网络等等。在学习每个节点的特征时,传统的机器学习方法并不能很好地利用图结构信息直接进行训练,以捕捉每个节点的上下文信息(Context)或者对其他节点的依赖关系。最近,图神经网络(Graph Neural Network)提出了一种通用的、利用图结构信息训练神经网络的方法,这里对其核心的思想进行一下总结。原创 2021-02-10 02:28:15 · 1204 阅读 · 0 评论 -
使用Contrastive Loss和Triplet Loss学习特征表达
在某些实际应用当中(例如人脸识别/鉴别、信息检索、行人重识别、内容推荐等等),我们也可以利用不同样本之间的关系,提升模型学习特征的能力。例如,我们可能希望相同类别样本的特征向量在某种度量空间(Metric Space)中是相近的,而不同类别样本的特征向量在该空间中尽可能远离。这里,我们可以使用对比误差(Contrastive Loss)或者三元组误差(Triplet Loss)来达到这一目的。原创 2021-02-10 01:43:59 · 961 阅读 · 0 评论 -
利用Transformer模型进行电影评论分类
Transformer模型可以理解为RNN模型中的“变形金刚”,在许多应用场景(例如机器翻译、自然语言处理)中都取得了很好的效果, 成为了目前研究领域的新主流。但不管当前研究人员的观点如何以及是否偏颇,我们作为普通的吃瓜群众而言,对于优秀的东西都是要不断学习的。本文会以电影评论分类的代码为例子,对其进行简要的探讨与总结。原创 2021-02-05 00:55:10 · 1671 阅读 · 5 评论 -
可训练的神经三维网格渲染器(Neural 3D Mesh Renderer)
如果说计算机视觉是将三维世界的视觉信息“编码”为机器可以理解的参数的过程,那么计算机图形学则是将参数化的三维模型“解码”为人类可以感知的三维世界的过程。从某种意义上来讲,如果不考虑转换过程中信息的损失,这似乎是一个可逆的过程;而如果能使用某种方式把计算机视觉的操作与计算机图形学的操作结合在一起,是不是能够像自动编码器(Autoencoder)一样而实现某种无监督学习的应用呢?原创 2021-01-29 08:34:32 · 4662 阅读 · 3 评论 -
利用生成式对抗网络(GAN)进行艺术创作
人类的创作过程,可以在某种意义上理解为“从无到有”(Creating)的过程或者“举一反三”(Translation)的过程。那么对于机器而言,我们可不可以使用某种模型来模拟这种过程呢?答案是肯定的。生成式对抗网络(Generative Adversarial Networks)是近年来计算机科学当中比较有趣的想法之一,本文将以创作数字图像为应用场景来对该模型进行介绍。原创 2021-01-22 08:59:28 · 1588 阅读 · 3 评论 -
使用自动编码器(Autoencoder)及其变体进行特征学习
自动编码器(Autoencoder)是一类无监督学习的特征提取方法,它由编码器(Encoder)和解码器(Decoder)两个部分组成。其工作的原理是,首先通过编码器将初始的特征映射到一个潜在的特征空间(通常该空间的维度远小于原始空间),再使用解码器将其重新映射到原始的特征空间当中。编码器和解码器通常使用神经网络结构来实现,在训练模型参数时会定义某种距离函数,来衡量输出数据与预期目标的误差。它主要的应用有数据压缩、数据去噪以及数据生成等等,这里给出一些示例代码以方便学习。原创 2021-01-18 23:38:25 · 5435 阅读 · 2 评论 -
使用协同过滤(Collaborative Filtering)模型实现内容推荐系统
内容推荐系统在音乐、电影、软件、交友及电子商务网站上有着很广泛的应用,它极大的方便了用户对感兴趣内容的探索,并一定程度提高了网站内容的流量。随着人们对该话题研究的深入,也出现了很多成熟的实现方法,它们大致可以分为三类:1)基于人工设计特征的过滤方法;2)基于协同过滤的方法;3)基于深度神经网络学习特征的过滤方法。本文主要对协同过滤模型进行介绍。原创 2021-01-03 03:22:36 · 851 阅读 · 0 评论