关闭

【问答集锦】人工智能/机器学习技术在电商场景下的应用

标签: 人工智能机器学习阿里巴巴
1061人阅读 评论(0) 收藏 举报
分类:

近年来阿里不断运用深度学习、强化学习等人工智能领域的相关知识优化自身电商平台的搜索引擎和推荐系统,让其从冷冰冰的系统不断成长为越来越懂用户的智能购物助手。
  日前,《尽在双11》人工智能部分执笔人&阿里技术专家 乐田 与 仁重 就 “人工智能/机器学习技术在电商场景下的应用” 问题在OSCHINA与大家开展了问答活动。
  本文整理了两位老师在开源中国高手问答中的精彩问答。

1 . 机器学习在电商方面除了广告推荐之类的方面外,还有其他的应用么?谢谢,还有学习这方面需要哪些知识

  机器学习在电商领域的应用从外部产品来看主要涉及3个:搜索、广告、推荐。从内部来看,从商品选品、流量生成机制、物流优化、物流机器人、智能客服、互联网信用贷款等方面都会用到机器学习。 学习机器学习有之前传统的统计学习例如《The Elements of Statistical Learning》,《支持向量机导论》、周老师的西瓜书等经典教材;现在最新的Deep Learning也出书了。

2 . 机器学习在阿里电商场景下的最常用算法有哪些?阿里对哪些算法做了有针对性的优化和改进呢?阿里目前推荐系统从用户访问到根据访问记录进行推荐的实时性是多久?

  LR、GBDT、RNN有不少人在用了,还有首创的MLR、ItemCF。。针对性的优化和改进主要是在适配阿里的计算平台和大数据方面,这方面例子比较多,如对ItemCF 的Swing算法。

3 . 现阶段的人工智能离传统的应用程序员还是很远,请问有什么办法能够快速普及吗?

  是技术发展过程中本身的分化导致的,技术发展就是要普惠更多的人,让更多的人参与门槛持续降低,无论怎么低,通晓基本原理和基本的训练是必要的,跟学编程差不多。

4 . 深度学习算法在实际应用中是否比较曲折,对于数据的抽象工作特别难,中小型公司是否更加适合随机森林这种非深度算法?

  选择团队能驾驭的算法,对于新方法可以培养团队的驾驭能力。

5 . Tensorflow 这个框架主要应用在哪些方面场景?

  用户和商品的Embedding、Wide&Deep、GANs等。

6 . 阿里有计划使用Tensorflow加入推荐系统里吗?

  有较多的场景在用Tensorflow了。阿里推荐系统的逻辑架构在《尽在双11》一书上有介绍,具体的基础设施可能阿里特色较多一些。

7 . 目前推荐系统多数是使用标签模式来给用户推荐吗?怎么判断用户符合系统推荐的商品?除了机器推荐,后期会有人为控制去跟进吗?

  部分推荐场景如“微淘”,是使用了标签进行推荐的。使用标签推荐的前提是这种推荐对象更适合标签的方式来描述。推荐体验分析相对搜索结果分析是个全新的问题,需要考虑个性化,还有选择评估样本的代表性。

8 . 让机器自动学习怎样去推荐,最后会不会连开发者都不知道系统是怎样推荐的?如果这时候发现系统推荐的商品有问题,怎样确定问题出在哪里?怎样调整系统的算法?

  这涉及到推荐系统的自省(reflection)能力,从实现上说,自省能力是推荐系统正向过程的逆过程,由于涉及算法比较复杂,逆向过程只能在部分上反映推荐过程是怎样的,一定程度上可以debug推荐结果的问题。

9 . 统计用户行为需要搜集并保留所有用户的所有行为,除了购买行为外还包括浏览行为、关注行为、加入购物车行为等,请问采用单元粒度的分布式架构是否更为合理?

  单元化是在服务端(在线服务)进行的,对用户数据汇总分析不是单元化的,而是把所有单元的数据汇总的结果。

10 . 外网的数据,如何整合到推荐系统里,提高推荐的正确性?

  外网的数据必须要能描述用户或推荐对象才能使用,而且考虑到站内的数据的完整程度,外网的数据补充进来价值会不同。

11 . 小公司要做实时推荐有什么框架可以使用

  选择开源的工具和平台,例如Spark、Storm等,结合HBase计算端存储和LevelDB、Redis等在线端存储应该是个可行的方案

12 . 阿里的推荐算法用的在线的多还是离线的多?因为可供学习的数据很多,每次从头来量应该很大。

  部分场景是纯在线的,部分场景是在线离线结合的,还有一部分是纯离线的。离线处理数据重新计算是个问题,因此离线也不太可能处理很长时间的数据。

13 . 现在很多推荐算法是不是有问题?总是推荐我买过的东西,并且从品牌层次和商家都不匹配。

  我们针对用户已经购买的商品进行了部分过滤,商品类目也是个比较复杂的事情,有时候看起来是一个品类的商品,实际上是属于不同的类目,比如运动鞋和男鞋就是不同的类目。这个问题已经比较久了,只能逐步解决。

14 . 算法程序建模之后,怎么验证代码的准确性? 程序员之间互测? 算法调优有啥思路?

  算法一般都会隐藏一些“bug”,只不过这些bug对结果的影响大小的问题,所以坊间也有通过修复bug来提高效果的。算法建模之后通过test数据集进行验证。

15 . 像淘宝每天每周都有很多新加入的商品,请问算法团队是如何做的?新加入的商品应该如何给排序值,确定值大小?

  冷启动的商品会分配极小的流量进行探索性投放。

16 . 目前可以使用算法编写的语言很多,python吗? 贵团队是如何决策的?

  底层的算法和工程系统使用C/C++开发,应用层适应多变的需求,使用Java开发,Python和Java的功能类似,在运行效率和库的完备度方面弱一些,也有使用。 
  最后,安利一下这本著作——《尽在双11》。本书以双11为着眼点,从技术的角度,展示了阿里巴巴的演进、变革与发展,系统地阐述了阿里巴巴重要阶段的技术进步历程。

                   图片描述

0
0
查看评论

【智能零售】电商领域居然存在着这些人工智能应用

作者:许小岩  来源:AI脑力波  授权 产业智能管 转载据国家统计局数据显示,2016年中国网上零售额51556亿元。预计到2017年,中国网上零售额将突破7万亿,占社会消费品零售总额的14.9%,网购用户渗透率达到64.0%。  目前,阿里巴巴和eBay这...
  • np4rHI455vg29y2
  • np4rHI455vg29y2
  • 2017-12-31 00:00
  • 606

阿里专家问答丨人工智能/机器学习技术在电商场景下的应用

《尽在双11》人工智能部分执笔人&阿里技术专家 乐田 与 仁重 就 “人工智能/机器学习技术在电商场景下的应用” 问题在OSCHINA与大家开展了问答活动。
  • broadview2006
  • broadview2006
  • 2017-05-03 09:36
  • 1678

教育将是人工智能技术最佳的应用场景之一

v 教育行业迟迟看不见一个淘宝式的大鳄、看不见一个用黑科技颠覆行业的项目。 为什么会造成这种局面呢?这一切都和教育行业的特点关系紧密。教育行业的核心商业模式主要有三种: 1,内容生产;这就包括出版社和自媒体在内的内容创造方。 2,技术支持;主要是教育类软硬件设备和...
  • gnicky
  • gnicky
  • 2017-08-08 21:00
  • 2714

人工智能大拿解答机器学习30个问答

人工智能 机器学习
  • u013553804
  • u013553804
  • 2016-04-27 19:04
  • 667

机器学习与人工智能将应用于哪些安全领域?

机器学习正在不断加的加快前进的步伐,是时候来探讨这个问题了。人工智能真的能在未来对抗网络攻击,自主地保护我们的系统吗? 如今,越来越多的网络攻击者通过自动化技术发起网络攻击,而受到攻击的企业或组织却仍在使用人力来汇总内部安全发现,再结合外部威胁信息进行对比。利用这种传统的方式部署的...
  • bystarlight
  • bystarlight
  • 2017-05-27 14:23
  • 1017

一个母婴电子商务网站的大数据平台及机器学习实践

母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当中,关心的是孕妈的一些问题,几个月以后,随着宝宝的落地,就会准备一些纸尿裤和奶粉,而且随着宝宝的长大...
  • lz0426001
  • lz0426001
  • 2016-02-17 16:01
  • 957

人工智能会如何影响软件测试行业?

传统的测试工具,通过让电脑执行一系列步骤,并根据预先定义的预期来检查结果。 那么,人工智能会在软件测试里扮演一个什么角色呢,机器软件测试人员?   也许。   想像一下按揭计算器的测试,不是按照预定义的几个例子,而是随机选择有效数据。 也就是说,选择随机利...
  • jiangbqing
  • jiangbqing
  • 2017-06-26 11:22
  • 1779

【技术分享】京东电商广告和推荐的机器学习系统实践

包勇军京东数字营销业务部架构师 2014年4月加入京东数字营销业务部,参与组建并带领数字营销部模型团队,自主研发出京东大规模机器学习平台,同时还负责京东电商广告系统深度学习算法应用和优化的工作。  分享内容 大家好,我是来自京东的包勇军,我今天分享的主题是《京东电商广告和推荐的机器学习系统...
  • Real_Myth
  • Real_Myth
  • 2016-10-24 10:48
  • 1714

SqlServer - 问答

存储过程和函数的区别 存储过程可以返回多个变量,函数只能返回一个变量 存储过程可以使用临时表,函数不可以 存储过程一般作为独立部分来执行,函数可以作为查询语句的一部分来调用 存储过程可以对整批数据进行处理,函数只能对某一个进行运算
  • itlwc
  • itlwc
  • 2013-09-16 12:00
  • 552

AR在未来商店中的应用

随着电商的快速发展,实体店以及零售店面临经营惨淡的状况,而且很多实体店都已经关门了,比如北京中关村的电脑城等。首先是电子产品,接下来可能会是其他一些实体产品。所以一些品牌的实体店经营者必须要想办法留住顾客,这就需要给顾客提供更好更新颖的购物体验,未来,借助AR是必然趋势。实体店不可能消亡,因为在实体...
  • ggtaas
  • ggtaas
  • 2015-02-13 16:49
  • 1667
    个人资料
    • 访问:3931689次
    • 积分:56563
    • 等级:
    • 排名:第57名
    • 原创:1462篇
    • 转载:83篇
    • 译文:1篇
    • 评论:3786条
    博客专栏
    文章存档
    最新评论