作者:禅与计算机程序设计艺术
1.简介
随着人工智能技术的飞速发展、应用落地及其广泛应用,在智能交互领域取得重大突破,越来越多的人开始重新思考人机交互方式。而语言和画图作为人类和机器沟通的方式,被视作最优秀的通信方式之一。然而,现代人工智能技术面临着巨大的挑战——从文本到图像再到视频,如何让智能体获取到高质量的信息并通过语言或者图片进行有效沟通是一个难题。因此,针对这一问题,本文提出了一种新的交互方式——ClipDraw。 ClipDraw 把绘画当做一种人机对话形式,与智能体进行即时沟通。用户通过触屏设备(例如笔记本电脑、手机或平板电脑)绘制自己的想法,智能体也会用相同的手法作出响应,并将他们的意图和思绪传达给对方,达成共鸣。智能体的语音识别功能可以使得双方语速一致,同时还可以减少语言切换的时间,降低沟通成本。除此之外,为了能够更加准确地表达用户的想法,智能体可以结合计算机视觉技术,识别用户的脸部表情、姿态等信息,进一步丰富对话内容。 基于上述目标,本文设计了 ClipDraw 框架,并开发了 ClipDraw 智能体程序。所开发的智能体程序可用于控制计算机、手机、平板电脑甚至打印机,实现人机对话。能够自动生成具有独特风格和情感的图像,帮助用户快速准确地表达自己的想法。