聊天机器人:如何构建信息架构来支持人工智能项目

我们触手可及的将人们与信息联系起来的技术不断发展。聊天机器人和虚拟助理是消费者、员工、患者等获取知识的主要门户之一。最有效的聊天机器人通过机器学习和允许自然语言提问的直观界面得到增强,并且可以成为用户访问组织知识库的最有用的门户之一。

也就是说,基础扎实的话。

先进技术只是难题的一小部分。在 Baklib,我们看到很多人在部署这些类型的先进技术失败后给我们打电话,尽管他们拥有优秀的开发人员。缺乏信息战略(基础)是他们的阻碍。

我将使用分类法、人工智能和聊天机器人作为框架,解释分类法和本体中信息策略的重要性,以使人工智能驱动的聊天机器人发挥最佳性能。

分类法如何支持最佳人工智能实践

人工智能、聊天机器人和分类法之间存在天然的关系。分类法是数据组织的基础级别:

“当信息按照分类法进行结构化和索引时,用户可以通过深入到更具体的类别、向上到更具包容性的主题或横向到相关主题来找到他们需要的内容。”

对用户有利的事情也对人工智能有利。拥有结构化数据可以缩短许多人工智能项目的价值实现时间,以便您可以尽快从技术投资中获得最大收益。

分类法及其更复杂的亲属本体论以多种方式与人工智能(AI) 技术互动、支持和驱动。组织从人工智能驱动的聊天机器人应用程序中实现的自动化和好处只与所使用的数据的质量一样好或坏。信息组织得越好,数据质量就越好,与业务和最终用户目标越一致,人工智能就越容易利用信息。不完整、错误或有偏见的数据将对用户体验和您的品牌产生不利影响。

如果您的梦想最终状态是一个运行良好的系统,可以向人们提供最相关的信息(说起来容易做起来难),请考虑分类法、聊天机器人和人工智能之间的关系。

分类法简史:Berrypicking 模型

1989 年,玛西娅·贝茨 (Marcia Bates) 发表了她的“浆果采摘”模型,该模型后来被证明是解决信息搜索问题的基础。

在线搜索界面的浏览和浆果采摘技术的设计。
版权所有 © 1989 马西娅·J·贝茨

贝茨描述了信息查找行为的关键要素,为解析话语并将其转换为查询提供了背景。这需要开发人员进行相当大的思维转变。本体提供了支持这个过程的能力,但是接口和交互仍然需要合并。

贝茨发现:

典型的搜索查询不是静态的,而是不断变化的。

搜索者通常以零碎的方式收集信息,而不是在一组最佳检索信息中收集信息。

检索者使用各种各样的检索技术,这些技术超出了通常与书目数据库相关的技术范围。

检索者使用书目数据库以外的各种来源。

查询不仅会得到改进,而且随着用户对信息理解的发展,它可能会发生显着变化并从一种模式转变为另一种模式。

实际应用与实施

事物变化越多……它们就越保持不变

Baklib 最近与一大批开发人员和人工智能工程师合作构建和实施新的聊天机器人——分类学家喜欢从头开始研究项目!我们有兴趣了解该项目与我们的标准信息架构项目有何不同。 Baklib 团队为电子商务、门户、分析、知识管理和其他类似项目开发了一种长期有效且有条理的方法。但基于人工智能的项目却令人望而生畏。我们已做好充分准备重新评估我们的整个聊天机器人方法,但对我们的方法如此持久感到惊讶!

我们的方法对信息环境有广泛的了解,并相应地收集需求。虽然这个项目需要深入研究技术及其实施方式,但我们标准评估方法的所有其他领域也是必要的。了解用户需求、可用内容、法律和安全问题以及聊天机器人的业务目标都是我们开发的本体模型的重要输入。

我们确定人工智能聊天机器人实际上只是另一个系统;另一组非常适合我们方法的要求。

每个聊天机器人都应该考虑的 5 件事

同义词、同音词、反义词等。

查询消歧

查询扩展/细化

识别跨域的关系

AI训练和规则、实体提取

考虑到上述核心能力,我们进入了评估阶段,以帮助我们确定必要的领域、变体的作用、关系、本体与内容交互的需要等。根据我们的评估,我们能够收集并向设计和构建聊天机器人的团队提供需求。下面的每个需求领域(粗体)都对整体本体模型有直接影响。

需求收集

分类法构建输入

评估之后,我们转而关注聊天机器人需要什么样的资源。企业分类项目有许多组件,包括治理、维护、系统集成等。对于像聊天机器人这样以查询为中心的项目,可以使用许多来源,包括:

从在线和文档内容中提取实体结果

审查搜索日志

支持团队记录的用户问题

行业标准分类法和术语

公开可用的支持文档

用户研究

本体工具培训和文档

获取分类法

聊天机器人有很多功能,但我们专注于那些可以通过分类/本体支持的功能。一旦我们将聊天机器人和本体功能列表并排放置,很明显聊天机器人功能在几乎所有可查找性项目中都很常见。认识到这一点有助于鼓励我们坚持基本原则。

聊天机器人的分类功能

同义词、同音词、反义词等。

查询消歧(即“土耳其”动物与“土耳其”国家)

查询扩展/细化(即“Terrier”→ Dog)

识别跨领域的关系(即狗→治疗辅助工具)

AI训练和规则、实体提取

Baklib 有机会与极其聪明且以信息为中心的工程师团队合作,这使得人工智能组件不再那么令人畏惧。我们不需要非常努力地让人们相信不同类型的词条(同义词、反义词、昵称等)的价值。当开发人员努力寻找与动词交互的最佳方式时,我们可以为他们构建一个“动词”分类法。

最后的想法

从宏观层面来看,据估计,糟糕的数据质量实践每年给美国行业造成数万亿美元的损失,给普通组织造成数百万美元的损失。不良的做法可能会减慢数字化计划、让员工感到沮丧,并可能促使客户转向更能满足其需求的竞争对手网站。为了避免所有的悲观和厄运,请记住以下几点。

始终考虑最终用户的目标。我们构建的本体直接受到内容领域和内容结构的影响。通过将最终用户目标作为我们的北极星,我们能够设计基本分类法,以满足未来技术、内容、业务目标和资源方面的不同聊天机器人功能。

将人工智能驱动的搜索基础设施视为一种多功能工具。智能搜索不仅利用跨企业数据孤岛和知识源的知识,还采用先进的人工智能、自然语言处理和深度学习来缩短为员工、客户、支持代理等提供服务的人工智能聊天机器人的价值实现时间。

投资强大的信息架构。不要完全依赖人工智能、深度学习和NLP来完成您的项目。出色的分类和信息架构工作对于获得最佳结果至关重要。它需要出色的信息架构设计和强大的治理方法,以确保为智能聊天机器人等大型人工智能项目提供支持所需的高质量数据。

相信这个过程。 Baklib 的本体/分类设计标准流程和评估非常耐用。人工智能驱动的聊天机器人可能看起来令人畏惧,但像对待任何其他分类项目一样对待评估过程有助于我们从根本上定义和解决问题,并与开发人员和工程师合作解决可查找性和用户满意度问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值