2019冠状病毒病大流行加速了2021年人工智能或机器学习的应用。企业对自动化的需求,加上人工智能硬件和软件的进步发展,有利于将人工智能应用变成现实。
2022年预计会出现的五大人工智能趋势:
趋势1:大型语言模型(LLM)定义下一波会话式人工智能
语言模型是基于自然语言处理技术和算法来确定一个给定的单词序列出现在一个句子中的概率。这些模型可以预测句子中的下一个单词
大型语言模型(LLMs)是在包含大量数据的大量数据集上进行训练的。谷歌的BERT和OpenAI的GPT-2和GPT-3是llm的一些例子。据悉,GPT-3在570 gb的文本上训练了1750亿个参数。这些模型可以生成任何东西,从简单的论文到复杂的金融模型
OpenAI、hugs Face、Cohere、AI21 Labs等人工智能初创公司正在通过训练具有数十亿个参数的模型,推动LLM的边界。
韩国公司Naver宣布,他们已经建立了最全面的基于人工智能的语言模型之一HyperCLOVA,一个类似于gpt -3的韩语模型。华为的pangug - alpha和百度的Ernie 3.0 Titan都接受过来自中国的海量数据集的训练,这些数据集包括电子书、百科全书和社交媒体。
到2022年,我们将看到大型语言模型成为下一代对话式人工智能工具的基础。
趋势2:多模态人工智能的崛起
传统上,深度学习算法专注于从一个数据源训练模型。例如,计算机视觉模型是在一组图像上训练的,而NLP模型是在文本内容上训练的。语音处理处理声学模型创建,唤醒词检测和噪声消除。这种类型的机器学习与单模态人工智能相关,其结果被映射到单一的数据类型来源——图像、文本、语音。
多模式人工智能是计算机视觉和对话式人工智能模型的最终融合,以提供更接近人类感知的强大场景。它将人工智能推理提升到一个新的水平,结合了视觉和语音模式。
多模态人工智能的最新例子是OpenAI的DALL-E,它可以从文本描述生成图像。这个模型的名字是艺术家萨尔瓦多Dalí和皮克斯动画工作室瓦力的合成词。例如,当文本提示“甜甜圈形状的时钟”被发送给模型时,它会生成以下图像。
谷歌的多任务统一模型(MUM)是多模式人工智能的另一个例子。它承诺将根据从75种不同语言中提取的上下文信息对搜索结果进行排序,从而提升用户的搜索体验。MUM使用T5文本到文本框架,比BERT(一种流行的基于变压器的自然语言处理模型)强大1000倍。
NVIDIA的GauGAN2模型将基于简单的文本输入生成逼真的图像。它结合了分割映射,inpainting,和文本到图像的生成在一个单一的模型,使它成为一个强大的工具,以创建逼真的艺术与文字和绘画的混合。基于简单文本输入的真实感图像展望未来,我们将看到计算机视觉和语言/语音模型的融合,使人工智能更自然、更丰富。
趋势3:简化和流线型MLOP
Machine Learning operations (MLOps),将机器学习应用于工业生产的实践是复杂的!可用于实现mlop的众多工具和框架使其势不可挡,
今天的MLOps在很多方面与2012年的DevOps很相似。组织很快意识到DevOps的价值,但由于缺乏指导,他们很难实现它。工具链很复杂,生态系统f繁杂。
MLOps是基于云的ML平台的概念之一,如Amazon Web Services的Amazon SageMaker、Azure ML和谷歌Vertex AI。然而,这些功能不能在混合和边缘计算环境中使用。因此,对边缘模型的监控对企业来说是一个重大的挑战。在处理计算机视觉系统和对话式人工智能系统时,监测边缘模型变得更加具有挑战性。
由于Kubeflow和MLflow等开放源代码项目的成熟,mlop已经变得非常容易访问。在未来几年,将会看到一种流线型和简化的mlop方法,跨越云计算和边缘计算环境。
趋势4:人工智能驱动的开发人员生产率
人工智能将影响IT的几乎每一个方面,包括编程和开发。
在过去的几年中,我们看到了一些工具,比如Amazon Code Guru,它们提供了智能的建议,以提高代码质量,并识别应用程序中最昂贵的代码行。最近,Github Copilot以“AI配对程序员”的身份首次亮相,以帮助开发人员编写高效的代码。Salesforce的研究团队已经推出了CodeT5,这是一个开源项目,将帮助Apex的开发人员进行人工智能编码。Tabnine,前身是Codata,将智能代码补全带入主流开发环境。Ponicode是另一个人工智能驱动的工具,可以创建可视化。
大型语言模型(LLM)的兴起和开放源代码的广泛可用性使IDE供应商能够构建智能代码生成和分析。展望未来,我们将看到能够从内联注释生成高质量和紧凑代码的工具。他们甚至能够将用一种语言编写的代码转换为另一种语言,通过将遗留代码转换为现代语言,实现应用程序的落实。
趋势5:平台公司的新型垂直AI解决方案
亚马逊(Amazon)、谷歌、微软(Microsoft)等领先的人工智能供应商正专注于将研发成果商业化。它们通过云平台提供托管服务,或构建硬件设备,配备人工智能加速器和针对特定场景的预先训练的模型。
Amazon Connect和Google Contact Center AI是垂直整合的经典例子。两者都利用了机器学习能力来执行智能路由、由机器人驱动的对话以及对呼叫中心代理的自动协助。
在家电方面,AWS Panorama和Azure Percept都提供了交包人工智能功能。AWS Panorama连接到现有的IP摄像机,以执行基于计算机视觉的推理。客户可以在云中训练新的模型,并将它们部署在部署全景设备的边缘。Azure Percept采用了类似的方法,在边缘提供计算机视觉和对话AI功能。微软基于Azure上现有的物联网、人工智能和边缘计算服务构建了Percept。
最后,Amazon Lookout for Equipment和谷歌Cloud Visual Inspection AI等服务利用云人工智能平台对设备进行预测性维护和产品异常检测。这些服务是高度定制的零售和制造业垂直行业。
到2022年,我们将看到人工智能平台和云提供商利用前沿研究和现有托管服务,针对特定的用例和场景提供解决方案。