如何提高QnA maker机器人训练中文语义理解的能力

640?wx_fmt=jpeg

这是一个常见的问题,在人工智能的世界里面,图像理解、语言及语义理解、数据理解是三个核心领域。而关于语言及语义理解,又与具体的语言和文字密切相关。目前来说,大家都是用机器学习去训练模型,如果要更好的理解中文,当然是要用中文的语义模型去训练更好。

听起来很简单的一个事情,最近我在使用QnA maker这个服务时却遇到一些小问题,深究了一下,也搞明白了他怎么选定语义模型的逻辑:当前来说,他会根据开发者定义的KB的素材,自动推断语言。

这可能是一个足够“智能”,但不够聪明的设计。

我发现问题的原因在于我在一个KB中,先是定义了一个Hi这种测试用的提问。然后又导入了一个中文的知识库材料。如下图所示:

640?wx_fmt=png

然后我在测试时发现,很多明明定义在question里面的短语,就是无法识别出来。例如

640?wx_fmt=png

我百思不得其解,后来发现这个KB的语言被识别为了英文,难怪呢。

640?wx_fmt=png

问题倒是找到了,但怎么调整这个设置呢?查了很多材料,也没有找到地方可以改设置。只能发邮件给产品组沟通。

640?wx_fmt=png

攻城狮们告诉我的情况是,让我重新建立一个KB,而且一定要确保第一个KB Pair是中文的。我顿时就明白了。

然后,你可以通过这个接口来验证当前你定义的Knowledge base是用什么语言来训练的。

https://westus.dev.cognitive.microsoft.com/docs/services/5a93fcf85b4ccd136866eb37/operations/knowledgebases_getknowledgebasedetails/console

640?wx_fmt=png

另外一个好消息是,根据我跟产品组的沟通,很快会有一个功能,就是让开发者自己可以手工地设定语言。

这当然是更加自然、而且合乎逻辑的设计。smiley_79.png

640?wx_fmt=jpeg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值