本周AI热点回顾:谷歌网络嵌入函数新专利惹争议、《麻省理工科技评论》千字长文点赞百度飞桨、AI还能一键卸妆...

01

谷歌网络嵌入函数新专利惹争议,网友:何时申请线性回归?

最近,谷歌又申请了一项深度学习算法专利,主题是「Using embedding functions with a deep network」。

对于每个深度学习研究者来说,有些算法、方法可以说是研究必备,拿来直接用也是一种日常,但如果有人申请了专利呢?

该专利的摘要描述如下:

本专利适用于在深度网络中使用嵌入函数(embedding functions)的方法、系统和设备,包括在计算机存储媒介上编码的计算机程序。其中一种方法包括接收包含多个特征的输入,其中每个特征具有不同的特征类型;使用各自的嵌入函数处理每个特征以生成一个或多个数值,其中每个嵌入函数独立地运算彼此的嵌入函数,并且每个嵌入函数用于各自特征类型的特征;使用深度网络处理数值以生成输入的第一个替代表征,其中深度网络是由多个层次的非线性运算组成的机器学习模型;使用 logistic 回归分类器处理输入的第一个替代表征,以预测输入的标签。

专利界面:

https://patents.google.com/patent/US10679124B1/en

这项专利的保护范围是怎样的呢?我们来看一下申请书的「权利要求(claims)」部分:

一种由一个或多个计算机执行的方法,该方法包括:接收包括多个特征的输入,其中每个特征具有不同的特征类型; 

使用第一个机器学习模型处理输入以生成输入的第一个替代表征,其中第一个机器学习模型是具有单层线性计算的线性模型; 

使用深度网络处理所述输入,以生成所述输入的第二个替代表征,此处的深度神经网络是由多级非线性运算组成的第二个机器学习模型;

使用 logistic 回归分类器处理输入的第一个替代表征和第二个替代表征,以预测输入的标签。

从专利界面披露的信息来看,这项专利已于 2020 年 6 月 9 日成效,到期时间是 2035 年 2 月 5 日。专利涉及的研究者包括 Jeffrey Dean 等谷歌大牛。

谷歌为多个 AI 算法申请专利的事情,在当时引起了广泛的讨论。Google AI 负责人 Jeff Dean 后来亲自解释说:「这些有关算法的专利是防御性质的,主要是为了防止谷歌研究人员的成果被其他机构申请专利后进行讹诈,进而引发经济损失。」

他明确表示,谷歌不会使用人工智能算法的专利来攻击别的公司。谷歌也不会用这部分专利来获利。

信息来源:机器之心

02

《麻省理工科技评论》千字长文点赞百度飞桨:推动产业智能化大爆发

6月23日,全球顶级科技商业杂志、美国麻省理工学院主办的《麻省理工科技评论》发文称,“百度飞桨深度学习平台正在推动工业人工智能崛起。”

《麻省理工科技评论》提到,疫情已蔓延至超过150个国家,全球经济面临困局急需转型,人工智能在此时为人们提供了抗击疫情新思路。百度将人工智能技术运用至工业创新上,彰显了 AI 和深度学习平台结合的优势并带来了广泛的影响。

MIT 报道称,基于百度飞桨深度学习模型开发出的森林无人机,已经帮助东南亚155个林业局将森林检查范围由原来的40%扩张至100%,并且执行效率比人工检查高出200%,有效预防森林火灾的发生。

事实上,助力森林巡检只是百度飞桨诸多落地应用中的一个缩影。据报道,目前基于百度飞桨开发出的一系列产品已经深入制造业、医疗、能源和垃圾管理等行业,助力行业数字化转型升级。

以垃圾分类为例,金漉科技依托于百度飞桨 Paddle Detection 中的实例分割模型(Mask-RCNN)开发出的垃圾分类机械手臂,可以快速准确识别不同类型的垃圾,相比于传统算法60%-90%的筛选率,百度飞桨的筛选率稳定在93%—99%,大幅提升垃圾分类的效率。

对于人工智能带来的改变,金漉科技 CEO 张志文深有感触,“在垃圾分类中使用人工智能可以带来更大的潜力,不仅可以节省96%的人力,而且可以优化分类并进一步识别难以分类的废物,更为重要的是,人工智能可以自我学习来优化垃圾分类。”

《麻省理工科技评论》则认为,百度飞桨通过 AI 技术能够帮助垃圾收集者规避在收集和分离垃圾过程中面临的风险。“这对于现代垃圾管理至关重要。”

信息来源:机器之心

03

0代码部署在线推理服务,调参工程师也可以轻松实现在线部署

常见的深度学习模型开发流程需要经过问题定义、数据准备、特征提取、建模、训练几个过程,以及最后一个环节——将训练出来的模型部署应用到实际业务中。

使用 Paddle Serving 部署在线推理服务的过程非常简单,主要分为 3 个步骤,获取可用于部署在线服务的模型、启动服务端和使用客户端访问服务端进行推理,也就是说最多 3 步就可以完成部署,是不是和把大象关到冰箱里一样简单?

在获取模型后,用户仅需要在服务器上执行如下命令即可部署推理在线服务。

python -m paddle_serving_server_gpu.serve - model fit_a_line/uci_housing_model --thread 10 --port 9393 --name uci

其中 paddle_serving_server_gpu.serve 是使用 GPU 部署在线服务的模块,如果使用 CPU 则是 paddle_serving_server.serve。其它参数则分别是模型所在位置、当前服务的并发数量、服务端口和 HTTP 服务的名称。

在部署成功后,用户就可以在自己的设备上使用如下 cURL 命令向服务器请求推理服务。

curl -H "Content-Type:application/json" -X POST -d '{"feed":[{"x": [0.0137, -0.1136, 0.2553, -0.0692, 0.0582, -0.0727, -0.1583, -0.0584, 0.6283, 0.4919, 0.1856, 0.0795, -0.0332]}], "fetch":["price"]}' http://X.X.X.X:9393/uci/prediction

其中 “X” 和其后的一串数字是波士顿房价预测这个模型用于推理的 13 个特征值,而 “price” 是咱们希望获取的推理结果。“X.X.X.X”是服务器的地址,而 “9393” 和“uci”分别和前面部署命令中 port 和 name 参数指定的值相对应。

以上过程可以说是完全 0 代码部署在线推理服务,当然这只是最简单的 Paddle Serving 的使用方式,其中服务端和客户端之间是使用的 HTTP 协议通信,我们可以把这种在线服务称之为 Web 服务。

为了方便用户使用 Paddle Serving,飞桨的工程师们开发了内置预处理模块 paddle-serving-app。paddle-serving-app 模块集成了许多辅助功能,可以帮助用户更快地体验示例推理服务、编写和部署自己的推理服务、分析推理服务中的各阶段耗时、对服务进行调试等。paddle-serving-app 的安装方法也很简单仅需要一条命令即可。

pip install paddle_serving_app

此外,paddle-serving-app 中内置了多种 NLP 和 CV 领域的示例模型的获取方法,用户可以通过执行如下命令即可下载模型文件压缩包,其中 model_name 为模型名称。

python -m paddle_serving_app.package --get_model ${model_name}

因此 Paddle Serving 配合 paddle-serving-app 有如猛虎添翼,可以帮助用户轻松完成更加复杂的在线服务部署场景。

信息来源:飞桨PaddlePaddle

04

AI又进阶!除了鉴别PS图片,还能一键卸妆

最近CVPR2020的论文集合在GitHub火了,CVPR2020-Paper- Code 的项目:

https://github.com/extreme-assistant/CVPR2020-Paper-Code-Interpretation已获得超5.2K Star(截至发稿),甚至一度排在趋势榜的前五名位置。

这是某位作者经历了换脸风化妆的约会套路后,才会提出了FM2u-Net“AI卸妆药水”,来帮助恋爱中的男女看清妆容下真实的脸。当然目前FM2u-Net的计算规模还非常大,计算量上应该还有优化空间。笔者不排除后续优化模型推出后,会有App直接嵌入一键卸妆的功能。

在去年CVPR2019大会上,Photoshop的母公司Adobe与伯克利共同推出的论文《Learning Rich Features for Image Manipulation Detection》技惊四座,他们提出的模型可以用于侦测图像是否有被PS过。

这款反PS工具准确率极高,根据论文数据显示,一般人眼分辨PS痕迹大约有53%的准确率,但是反PS工具识别准确率高达99%以上。

到了CVPR 2020,妆容迁移的问题明显在人脸识别的领域中得到了更多的重视,比如我们马上要解读的这篇FM2u-Net的论文,就将视角完全聚焦在了妆容不变性上。

可以说“照骗”一族和“化妆”一族在AI的侦测下,通通都只有立现原形的份,按照目前的趋势发展,只要整合了整容不变性技术,AI就基本集齐龙珠,实现火眼金睛了,所以明年整容迁移问题能否成为CVPR2021的焦点话题,值得我们拭目以待。

信息来源:AI科技大本营

05

本周论文推荐

【ACL 2020 | 百度】:AI 辅助临床诊断

Towards Interpretable Clinical Diagnosiswith Bayesian Network Ensembles Stacked on Entity-Aware CNNs

论文介绍:

基于电子病历(EMR)的智能化诊断算法是 AI 医疗研究领域最重要、最活跃、应用最广泛的问题之一。

传统的诊断算法或者直接使用端到端分类模型,丢失了可解释性,或者仅基于知识关系和规则进行推理,可迁移、可扩展性低。本研究提出一种新的诊断算法框架,该框架针对EMR具有无结构化文本和结构化信息并存的特点,结合医疗NLU,以深度学习模型实现EMR的向量化表示、诊断预分类和概率计算。

结合医疗知识图谱增强的多种贝叶斯网络的组合模型,实现具有可解释性的诊断推理。该框架能同时兼顾高诊断准确率和强可解释性的特点,并可应用于面向基层医师的辅助临床诊断产品中。

END

展开阅读全文
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值