阿里文娱永叔:利器or成本损耗?算法不是黑匣子

2018年9月16日,由AICUG人工智能技术社区、Datafun社区、博学联合主办的2018 AI先行者大会于杭州召开,来自阿里文娱、科大讯飞、京东、华为、微软、腾讯、平安壹钱包、宜信、地平线、格灵深瞳等企业的数十名技术专家向参会者分享了国内不同行业公司的AI实践经验。集百家之长,将AI研究与应用领域最新的成果进行分享呈现。

作为实现人工智能的一大途径,机器学习与业务的深度结合一直是技术爱好者们关注的方向,会间,我们邀请到阿里商业机器智能算法团队及优酷算法技术团队负责人王晓博(永叔),围绕机器学习的落地应用实践展开问答,以下为正文:

CSDN:首先,请您做一下自我介绍,包括您所关注的技术领域,以及您所在的团队等。

永叔: 我10年博士毕业,主要从事数据挖掘方向,先后在百度搜狗负责广告策略算法团队,工作内容涉及展示广告和搜索广告。15年3月加入阿里,主要负责淘宝主站的推荐,即淘宝商品的信息流推荐,例如首页的猜你喜欢。从今年开始同时负责两个事业群的算法团队,其一是淘宝技术部商业机器智能的算法团队,主要涉及2B的商家端智能,同时也有2C的业务,包括内容及商品的推荐。在文娱方面主要负责整个优酷的算法技术平台,包括优酷的搜索、推荐、内容理解、会员的智能营销,以及后端的云端引擎平台等。技术领域方面,我主要关注两个方向,一是计算广告学,二是这几年一直从事的推荐算法。

CSDN:请谈谈您及团队在现阶段的研究侧重点或下一步研究和实践(例如应用到哪些领域)计划?

永叔: 目前我们(优酷)的研究重点包括:

① 内容理解:从过去的整体内容理解到元素级的内容理解,我们的目标是尽量缩小机器和人在看完一段视频后所能获取信息的差距;
② 多模态的视频搜索和推荐;
③ 小样本和领域知识相结合。

CSDN:是什么契机让您选择了大规模分布式机器学习这一研究分支?

永叔: 我的博士课题是复杂网络(Complex Network),也就是图挖掘方向,但是在我加入百度广告策略算法团队时,团队里PhD比较少,那会大家去高校、研究所的比较多。而当时(09、10年)也正是机器学习被大批量引入互联网公司的时期,我就被“丢到”一个我完全陌生的领域——点击率预估,参与网盟广告的点击率预测。点击率预估就是一个典型的0-1二分类问题,但由于其面临的数据体量非常庞大,为了尽可能提升预估的准确率,我们用了半年的数据来做预估,因此可以说我是由于业务原因,而进入了大规模机器学习领域。

CSDN:在您看来,机器学习在人工智能的发展中扮演着怎样的角色?深度学习对机器学习的意义?

永叔: 人工智能领域其实很宽,从最早大家提及的人工智能,到后来逐渐代之以机器智能,机器学习为人工智能提供了一条可以实际应用落地的道路。因为过去谈到人工智能就是下棋、语音识别等,而从80年代末90年代初,统计机器学习逐渐占据垄断地位之后,该技术可以与任何行业进行深度结合。无论数据量多少,机器学习技术都能帮助提效,且具备一定的预判性。

深度学习本身并不是一个很新的概念,也就是六七十年代就曾提出的人工神经网络(ANN),其本质相当于把所有事情变成一个学习非常复杂的非线性函数,模型的参数数量代表了模型本身的建模表达能力,比如学习一个简单的线性函数,还是一个超越函数,甚至一个非常复杂的逻辑函数,深度学习相当于提供了一个可以规模化的方法,每个学习单元就

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值