你相亲成功的几率有多高?机器学习硬核预测

本文介绍了阿里云机器学习平台PAI的云端深度学习开发环境DSW,如何帮助算法工程师高效开发。通过实例展示了DSW的使用,包括创建实验室、Notebook操作等。此外,利用快速相亲数据,通过DSW进行数据分析,建立预测相亲成功率的机器学习模型。
摘要由CSDN通过智能技术生成

image.png

一 序

人工智能(AI)是一个自从计算机被发明开始就存在的一个技术领域。从1956年Marvin Minsky、John McCarthy等人在达特茅斯学院的会议中第一次提出人工智能这个概念开始,AI这个领域的概念、技术和研究经历了非常长足的发展。

其中,机器学习是人工智能领域当中最核心也是最广泛应用的一个子领域,旨在通过一系列数学的方法,如统计、概率论、线性代数等方法,设计和分析让计算机可以自动学习的算法。这些算法通过从大量数据中获取规律,来对未知的的数据进行预测和决策。

机器学习的算法被广泛地用到计算机视觉、语音、自然语言处理、数据挖掘、搜索、广告、游戏、机器人、金融等各种行业。

随着深度学习的兴起,产业界对于机器学习产生了非常强烈的兴趣,也使得机器学习领域开始迅速地走向工程化和系统化。

除了机器学习算法本身的不断创新之外,数据和算力的增加也是不可忽视的:大量的数据,特别是移动互联网的兴起,使机器学习算法得以打破传统数据量的限制;由于GPGPU等高性能处理器开始提供大量的算力,又使得我们能够在可控的时间内(以天为单位甚至更短)进行exaflop级别的算法训练。

在这些的综合作用下,工业界开始浮现出大量的机器学习系统创新。以2011年Google Brain,即谷歌大脑为代表,机器学习开始迅速从实验室转向业界。

毫无疑问,深度学习(DeepLearning)是当下最热门的人工智能技术,在智能推荐、图像识别、机器翻译、计算广告、自动驾驶等领域都有突破性的进展和应用。而深度学习的成功很大部分得益于新的计算框架和异构计算硬件,譬如Tensorflow和NVIDIA GPU。

然而,对于算法工程师来说,要搭建这样一套学习和工作的环境不是一件容易的事情:需要一个特定版本的操作系统(最好是Linux),一张或多张GPU卡,安装GPU驱动,安装深度学习计算框架和其依赖的软件包等。在调试深度学习算法的过程中,如果说尝试不同的驱动版本和切换各种版本的软件库还勉强可以接受,那么切换硬件环境,特别是更换GPU卡就伤筋动骨了。

那么,有没有能够一劳永逸解决这些苦恼的方式?阿里云机器学习平台PAI出品的一款云端深度学习开发环境:DSW(Data Science Workshop)试图告诉你,这是个肯定的答案。

二 云端IDE:阿里巴巴机器学习与PAI-DSW

经过20年的快速发展,阿里巴巴已经组建了一个庞大的商业生态圈,并在支付、云计算、本地生活服务等行业保持互联网巨头地位。其中电商年交易额达到5.7万亿元、占据中国网购市场超6成份额,阿里云支撑了2019年双11 期间峰值 54.4 万笔/秒、单日数据处理量达到 970PB 的世界级的流量洪峰,成为业界第一个实现此壮举的云计算公司。

阿里云机器学习平台正是伴随着这样庞大而复杂的阿里经济体业务需求成长起来的。下面我们将带着大家掀开阿里云机器学习技术大图的一角,看看阿里云机器学习,特别是机器学习工程上的发展、沉淀和创新。

阿里机器学习技术大图

我们从用户和技术的两个角度来梳理机器学习的技术体系大图。从用户的角度来说,根据使用机器学习的深度不同,在云栖大会上,我们展示了飞天AI平台的技术分层关系:

image.png

从技术的角度说,机器学习从算法到底层的硬件,都涉及到不同的技术方向。下面是我们对于核心技术能力上的一个总体描述:

image.png

每个技术方向上都形成各自的布局和沉淀,接下来我们会重点讲述作为机器学习重要组成部分的工程能力体系建设。

机器学习工程能力体系

阿里云在机器学习工程体系建设上,也经历了各领域业务需求驱动和技术驱动分阶段螺旋式递进上升的过程。由最初的通过传统机器学习算法进行数据价值的粗加工,到今天以深度学习为主、支撑各类“行业大脑”解决方案的人工智能工程体系。

阿里云的机器学习工程能力体系建设始终围绕着更高效的融合人工智能三要素(算法、数据、算力)进行展开,即追求不断提升整个工程体系中的计算效率、数据效率以及工程效率,从而能够更好的支撑阿里经济体各方面业务快速发展的需求,并通过阿里云对外进行技术输出,推动人工智能领域的技术变革,产生更大的社会效益,实现普惠人工智能。

经过多年的发展创新,阿里云在AI托管平台技术层进行了系统性的建设,极大提升了算法研发、共享、部署、输出的效率,在此基础上沉淀出多个具有用户粘性和场景差异化的开发平台,这里我们选取阿里云机器学习PAI(Platform of Artificial Intelligence)作为代表来着重来介绍。

PAI是一款覆盖机器学习全流程的一站式机器学习平台产品,集数据预处理、特征工程、自动调参、模型训练、在线预测为一体,为用户提供低门槛、高性能的云端机器学习服务。

PAI相关技术脱胎于阿里集团内数十个BU的上千个业务体系,沉淀了大量的覆盖各个领域的优质分布式算法、框架、平台等,同时也在不断完善和扩充机器学习生态。

image.png

阿里云机器学习PAI-DSW

作为在AI战线上辛勤耕耘的算法工作者,你是否也常常遇到下面的情形:

  • 算法需要运行在GPU上,可是长时间申请不到GPU机器,只能干着急。
  • 终于GPU机器申请到了,安装G
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值