Google 公开 AI 发展三大方向，直言一切才刚刚开始

最新推荐文章于 2024-08-12 09:46:50 发布

AI先锋

最新推荐文章于 2024-08-12 09:46:50 发布

阅读量449

点赞数

Google 稍早在日本东京总部举办 AI Day，与来自日、韩、中等11个国家、将近60家媒体，说明有关 Google 发展 AI 的三个方向，强调 AI 主要在帮助人类解决日常所需，并非用来取代人类。而对所有领域来说，AI 跟机器学习虽然有很大的进展，但一切都只是刚起步而已，唯有人工智能进入人类生活，才能抓住它改善全人类生活的潜力与机会。

Google 发展人工智能已经长达15年，不过近期来说，全球人工智能真正开始积极推展的，主要还是 AlphaGo 在韩国对上李世石一役，因为围棋拥有惊人的10 的170 次方种可能的棋盘布局，相较于1997 年打败棋王Gary Kasparov 的西洋棋程式 DeepBlue，可谓大幅度进展。

首度抵日的 Google 研究团队资深研究员 Jeff Dean 在这次的大会中揭示 Google 发展 AI 的三个方向，分别为「贴近人类需求的Google 产品」、「持续打造创新的服务跟应用」，以及「研究出可解决人类难题的工具」。

Google 研究团队资深研究员 Jeff Dean。

方向一：持续打造创新的服务跟应用

大家都知道，Google CEO Sundar Pichai 在 Google I/O 期间，曾明确揭示 Google 公司的下个十年将会从 Mobile-First 朝向以 AI-First 为核心发展。事实上，像是Android、Chrome、Google Search、Google Play、Gmail、Google Maps、YouTube 等 7 个导入人工智能的产品，目前已经有超过 10 亿用户。

Jeff Dean 在现场展示了透过机器学习怎么样学习猫、狗、汽车、苹果、花等影像，然后最后辨识出猫。现在透过 Goolge Lens 可以辨识狮子、声音语调、文字内容，甚至照片，好比说你给他一张火车的照片，系统已经可以清楚辨识，并告诉你这是一辆蓝、黄相间车身的火车，目的地是往哪里。

除此之外， Google Lens 还可以轻易辨识地点、路边书本的名字、图片上的地图、拍摄美术馆，还可以进一步了解美术馆正在展览的内容，而导入机器学习的 Gmail 现在可以成功阻挡 99.9% 的垃圾邮件；最新推出的 Google Home 可支援多达 6 个人的语音配对。

其他还有像是 Google Play Music 透过导入 AI 技术，能理解用户喜欢的音乐、然后提供相对应的个性推荐。如果是美国部分城市用户，使用 Google Maps 还有「停车预测」功能，其背后更集合了群众回馈以及机器学习技术，建构了一套系统来帮助使用者预测停车位。至于大家几乎每天使用的 YouTube 平台，透过机器学习为YouTube 自动上了超过十亿支影片，让全球三亿以上的失聪或听障朋友也能了解影片内容。 Google 翻译透过神经机器翻译系统 (Neural Machine Traslation, NMT)，也有效提升翻译的品质，目前已可支援近 97 种语言跟英文的互译，其中包括许多亚太地区的语言...等等。

Google Maps 在美国 25 个城市提供停车厂建议功能。

透过 Google Lens 可以在拍下照片之后，确实了解身边的事物，或者快速翻译不熟悉的语言。

透过导入机器学习，现在 Gmail 与 Inbox 已经能够 12% 辨识信件内容，并给予回覆建议。

方向二：贴近人类需求的产品

除了软件之外，这两年积极抢攻硬件市场的 Google，同样透过 AI 进行产品软硬件整合。负责 Google Pixel 相机开发的产品经理 Isaac Reynolds 表示，透过 Googe Home，家中的所有人（最多同时6 人）都跟机器对话，而机器可以快速回应各种不同需求，好比说请它设定房间的闹钟、问它义大利的时间、要它开启客厅的电视并播放 Netflix 等等，而且可以清楚辨识每个人的声音，这是深度学习的一环，Google 已经导入超过 1000 个不同的房间位置的声音模组，现在透过机器学习机制，它能了解每个人的声音、回应每个人的需求，后续推出的 Google Home Max 是高阶的音箱，提供跟Google Home 一样的功能，并且更能够理解人们的所在地点。

Google HOME 的实际应用很广，可在居家辨别6 个不同的家族成员的声音，并给予即时回应，包括可以在电视还未开启的前提下，使用「帮我在电视里秀出我养的狗狗的照片」的指令。

至于 Google Pixel 的人像模式，同样也是导入机器学习技术，借由认识环境，以及谁是主体，借此模拟出景深效果。至于 Pixel 2 人像模式又更进阶，除了上述的学习机制，透过两个不同的 Photodiode，在一个非常小的单镜头当中，可以认识环境做出深度地图，有效区别出人像与背景，接着将「划分遮罩」和「深度图」组合成一张优化过的深度图，然后根据估计的距离决定背景模糊的程度，两者互相结合起来，做出更自然的人像模式。

Google Pixel 相机开发产品经理 Isaac Reynolds。

方向三：研究出可解决人类难题的工具

首先谈到自然语言学习，Google 人工智慧研究总监 Linne Ha 分享一位名为 Arm 的故事，一名泰国工人透过跟机器对话，转换成文字之后，成功找到失散多年的家人。目前全球有超过6000 种语言，当中的4000 种语言人口只有100 万人，如果能够透过机器学习的技术，让每个能够上线的人们都能用自己的语言与其他人交流，将可望创造更多类似Arm 的故事。

Google 人工智慧研究总监 Linne Ha。

除了自然语言，最近这几年相当火红的语音助理当中，Google Assistant 应该是近年来最具有人工智慧色彩的语音助理。 Google Assistant 工程技术总监Pra Gupta 表示，一年前推出的 Google Assistant，现在已经在搜寻、Google Maps、Android Wear、Android TV、Google Home 等服务当中都有她的影子，透过Google Assistant 用户可以轻易地控制家电、操作App，而且不用遥控器就可以让电视透过声控的方式启动、选择影片等等。

Pra Gupta 指出，Google Assistant 还在成长当中，目前支援英文、德文、韩文、西班牙文、法文、义大利文、日文、葡萄牙文，现在希望能为更多的装置提供 Assistant 服务。

Google Assistant 工程技术总监 Pra Gupta。

而事实上除了Google Assistant，Google 云端平台开发顾问 Kaz Sato 表示，Google 发展云端应用超过18 年，现在也已经全面导入 AI 技术，现在已经可以有效地处理旗下与第三方合作厂商各项服务的后端处理，这包括影像分析、数据管理等等，有效提升企业运作效率。

除了 Google 内部，这次也有第三方合作厂商导入 AI 技术。像是创立于 1919 年的儿童食品公司 Kewpie，在日本因为当地需求，需要加速生产才能因应市场变化，因此该公司最后选择导入 AI 技术。

正所谓「好的产品从好的想法开始」，AI 提供许多很好的建议，好比说透过AI 来协助检验哪些马铃薯是适合婴儿食用，快速筛检哪些条件的马铃薯是不适合食用的，初期食品厂在 2 个月内提供 AI 超过100 万颗马铃薯给它辨识，像是有些马铃薯已经变色了、代表不安全，借此减少人工检测上的负担，现在生产线已经突破以往的生产效率。这是我们与 Google 合作的一个重大突破。

儿童食品公司Kewpie 导入 AI 技术，透过机器学习的方式协助机器每天过滤上万颗马铃薯颗粒，协助控管儿童食品安全。

谈到机器学习，Google 研究团队产品经理、医学博士彭浩怡（Lily Peng）再次说明了Google 与印度当地医疗机构的合作，以及透过机器学习能够快速筛检出糖尿病视网膜病变，借此知道哪些人是高风险的糖尿病患者。

Google 研究团队产品经理、医学博士彭浩怡（Lily Peng）分享 Google 怎么与第三方医疗机构协助贫苦人家进行诊断医疗。

人工智能应用也能应用在生态环境保护方面，新西兰威灵顿维多利亚大学博士Victor Anton 分享他在威灵顿，透过多的设置录音装置（如黄色的点），录制超过 15,000 小时的声音资料，接着搭配机器学习的方式，然后整理资料、训练Tebsorflow、测试、分辨，让机器可以明确分析出哪些鸟在什么时候在哪些地方。

新西兰威灵顿维多利亚大学博士 Victor Anton 分享他在威灵顿，透过多的设置录音装置（如黄色的点），搭配机器学习的方式，分析鸟类习性。

举例来说，透过不断的测试，团队已经可以清楚了解 Kakariki、hihi 两种不同的鸟叫声，下一步，只要透过手机，就可以确认附近会有哪一种鸟。

Victor Anton 表示，目前团队已经训练三种鸟类模组，透过搜集影像跟相关资料了解动物行为，包括他们迁徙的状况、猎食与被猎食的状况，对于政府与保育团体来说，这类型的研究可说已经解决生态保育当中最大的难题，实际上当地政府也不断透过提供资源跟技术，应用在生态保育。

不过毕竟导致鸟不在某个栖息地的变因很多，这包括鸟的栖息地、移动的位置，透过机器学习还没有办法一次性的解决所有人类对于动物生态的问题，目前还是需要透过专业研究、以实验的方式搭配足够量的数据，不过目前这些数据还未公开，主要的原因是整个研究还未结束，透过参数的调整，研究出一个模组之后，才会分享给更多保育团体参考。

Google 发展 AI 的下一步

谈到下一步，Google 这次谈得相当深入，包括建构出更普及的机器学习(Accessibility of building ML)训练模组，这包括在教育领域帮助更多人建构自己的机器学习模型，内部也将持续透过机器学习速成课程，训练更多Googler。外部将扩大影响范围，募集更多学生与科学家参与培训计画，预计 2018 年初会把这个免费的线上课程开放给所有使用者。

Jeff Dean 也谈到 SketchRNN 跟 Auto Mechine Learning，前者让使用者和神经网路一起合作画画。使用者仅需画一朵花就能让系统自动完成画作。后者透过建立一组作为控制组网路 (controller network) 的神经网路能够推导出上千个子模型架构 (“child” model architecture)，以找出执行效率最好的一个子模型架构。

而在未来，Google 希望能有效提升机器学习技术的精准与正确性，目前也开放让公民大众参与研究，为 TensorFlow 提供足够的训练资料并验证分类的正确性。

再者透过远端感测可以让科学家更轻易的获得大量数据资料，未来希望透过建立人工智慧开源的方式，让生物学家可以利用机器学习归纳大量数据，其他时间就可以省下来做后续的结果判读和归纳，进而更有效的保育鸟类。

相较于微软亚洲研究院院长洪小文在 AI Day 当中宣布微软投入 AI 领域的六大承诺、三大研发面向、以及十二项产业应用情境，Google 研究团队资深研究员Jeff Dean 在这次的大会中揭示 Google 发展 AI 的三个方向，两者其实都是殊途同归，同样着重携手开发者导入自家人工智慧研究，不过微软看起来比较朝向商务合作领域发展，而 Google 则是著重人本应用，从行动面下手。

Jeff Dean 表示，在理想的人工智能之前，我们相信一切只是开端，并相信唯有让人工智能进入每个人的生活，才能发现与抓住它改善全人类生活的潜力和机会。

AI先锋

ID：EnlightAI

关注人工智能行业发展，介绍人工智能技术与产品