![](https://img-blog.csdnimg.cn/20190804191125334.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
人机交互系统
人机交互系统设计
两只橙
全球AI挑战赛百强选手,曾任职于腾讯微信事业部,魅族flyme事业部,中国平安人工智能团队。《深度学习500问》作译者,CSDN博客专家及签约讲师,指弹吉他爱好者,简书专栏作家。
展开
-
个性化推荐系统设计(2.2)——Few-shot Learning用于冷启动的探索
在推荐领域,我们常常会遇到冷启动的问题,这可能在所有的推荐项目中或多或少都会涉及。对于该问题,通常的解决方法如下:①(提供非个性化的推荐)比如先推荐热门排行榜,收集一定用户数据后,再进行个性化推荐;②(用户冷启动)利用注册时的用户信息粗粒地个性化推荐;③(用户冷启动)使用用户注册登录后对某些物品进行反馈的兴趣信息进行个性化推荐。;④(物品冷启动)对于新加入的物品,可以利用内...原创 2019-07-28 10:06:35 · 1139 阅读 · 0 评论 -
个性化推荐系统设计(4.1)——案例分析
在过去的十年中,神经网络已经取得了巨大的飞跃。如今,神经网络已经得以广泛应用,并逐渐取代传统的机器学习方法。 接下来,我要介绍一下YouTube如何使用深度学习方法来做个性化推荐。由于体量庞大、动态库和各种观察不到的外部因素,为YouTube用户提供推荐内容是一项非常具有挑战性的任务。YouTube的推荐系统算法由两个神经网络组成:一个用于候选生成,一个用于排序。如果你没时间仔细研究论文,可以...原创 2019-05-19 00:16:23 · 4207 阅读 · 0 评论 -
个性化推荐系统设计(2.1)——推荐算法介绍
协同过滤算法协同过滤(Collaborative filtering, CF)算法是目前个性化推荐系统比较流行的算法之一。协同算法分为两个基本算法:基于用户的协同过滤(UserCF)和基于项目的协同过滤(ItemCF)。基于属性的推荐算法基于用户标签的推荐统计用户最常用的标签,对于每个标签,统计被打过这个标签次数最多的物品,然后将具有这些标签的最热门的物品推荐给这个用户。这个...原创 2019-05-11 17:54:58 · 2156 阅读 · 0 评论 -
个性化推荐系统设计(3.1)——如何评价个性化推荐系统的效果
准确率与召回率(Precision & Recall) 准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。 一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多...原创 2019-04-20 23:46:09 · 1831 阅读 · 0 评论 -
人机交互系统(1.1) ——Annoy算法(海量数据查找)
前言一旦文档变成这种稠密向量形式,那如何从海量文本中快速查找出相似的Top N 文本呢?这就不得不提到一个海量数据相似查找算法——Annoy算法。算法原理建立索引Annoy的目标是建立一个数据结构,使得查询一个点的最近邻点的时间复杂度是次线性。Annoy 通过建立一个二叉树来使得每个点查找时间复杂度是O(log n)。 看下面这个图,随机选择两个点,以这两个节点为初始中心节点,执行聚类...原创 2019-03-02 18:46:53 · 2049 阅读 · 0 评论 -
人机交互系统(1.2) ——深度神经网络(孪生网络)
一、前言深度神经网络通常比较擅长从高维数据中学习,例如图像或者语言,但这是建立在它们有大量标记的样本来训练的情况下。然而,人类却拥有单样本学习的能力——如果你找一个从来没有见过小铲刀的人,给他一张小铲刀的图片,他应该就能很高效的将它从其他厨房用具里面鉴别出来。这是一种对人类来说很容易的任务,但是直到我们想写一个算法让它去做这件事……那就GG了 。很明显,机器学习系统很希望拥有这种快速从少量样...原创 2019-03-01 17:23:48 · 2976 阅读 · 0 评论 -
人机交互系统(1.3)——自然语言处理过程
一、收集数据1.1 数据源的样例每一个机器学习问题都是从数据开始的,比如电子邮件、帖子或tweet列表。常见的文本信息来源包括:产品评论(亚马逊,Yelp,各种应用商店)用户生成内容(tweet、Facebook帖子、StackOverflow问题)故障排除(客户请求、支持票、聊天日志)“Disasters on Social Media” dataset“社交媒体灾难”数据集...原创 2019-06-09 12:48:34 · 2671 阅读 · 0 评论 -
人机交互系统(2.1)——深度学习分布式计算框架
1 为什么需要分布式计算?在这个数据爆炸的时代,产生的数据量不断地在攀升,从GB,TB,PB到ZB。挖掘其中数据的价值也是企业在不断地追求的终极目标。但是要想对海量的数据进行挖掘,首先要考虑的就是海量数据的存储问题,比如TB量级的数据。谈到数据的存储,则不得不说的是磁盘的数据读写速度问题。早在上个世纪90年代初期,普通硬盘的可以存储的容量大概是1G左右,硬盘的读取速度大概为4.4MB/s.读取...原创 2019-07-04 22:55:32 · 2952 阅读 · 1 评论 -
人机交互系统(2.2)——Embedding的历史由来
1 前言首先回顾一下自然语言处理中的一个基本问题:如何计算一段文本序列在某种语言下出现的概率?之所以称其为一个基本问题,是因为它在很多NLP任务中都扮演着重要的角色。例如:去哪 。。。联想到“ 吃饭!”的概率,即“吃饭”这个词在“去哪”这种语言环境下出现的概率。2 词向量最早的词向量是很冗长的,它使用是词向量维度大小为整个词汇表的大小,对于每个具体的词汇表中的词,将对应的位置置为1...原创 2019-07-07 12:42:55 · 2290 阅读 · 0 评论 -
人机交互系统(3.1)——NLP文本数据增强方法
一、数据增强的背景和应用场景随着AI技术的逐步发展,更好的神经网络模型对数据规模的要求也逐步提升。而在分类任务中,若不同类别数据量相差很大,模型则会出现过拟合现象,严重影响预测的正确性。从广义上来讲,有监督模型的效果相对半监督或无监督学习都是领先的。但是有监督模型需要获取大量的标注数据,当数据需求达到十万、百万甚至更多时,人工标注数据昂贵的代价已经让很多人望而却步。如何利用有限的标注数据,...原创 2019-08-03 11:13:40 · 5546 阅读 · 1 评论 -
人机交互系统(4.1)——深度学习在人脸检测中的应用
1 人脸检测在目标检测领域可以划分为了人脸检测与通用目标检测,往往人脸这方面会有专门的算法(包括人脸检测、人脸识别、人脸其他属性的识别等等),并且和通用目标检测(识别)会有一定的差别,着主要来源于人脸的特殊性(有时候目标比较小、人脸之间特征不明显、遮挡问题等),下面将从人脸检测和通用目标检测两个方面来讲解目标检测。1.1 目前主要有人脸检测方法分类?目前人脸检测方法主要包含两个区域:传统人脸...原创 2019-07-04 23:26:06 · 1847 阅读 · 1 评论 -
人机交互系统(1.4)——Trie树详解
一、Trie树应用在 NLP 中一般会用其存储大量的字典字符以用于文本的快速分词;除此之外,典型应用场景还包括大批量文本的:词频统计、字符串查询和模糊匹配(比如关键词的模糊匹配)、字符串排序等任务;由于 Trie 大幅降低了无谓的字符串比较,因此在执行上述任务时,其效率非常的高。二、Trie树简介Trie 树中文名叫字典树、前缀树等等。这些名字暗示其与字符的处理有关,事实也确实如此,它主要用...原创 2019-09-19 23:49:58 · 3164 阅读 · 6 评论