再探Watson服务

最新推荐文章于 2024-10-04 20:38:10 发布

Joe?

最新推荐文章于 2024-10-04 20:38:10 发布

阅读量116

点赞数

文章标签：网络人工智能嵌入式

原文链接：https://segmentfault.com/a/1190000009197108

版权

基于上个系列的关于Watson的介绍。我在这个系列会对Watson进行更深一步的探究和使用，主要使用文本语音转换，自然语言分析，文本分类这几个服务做一个简单的人机交互系统，初步目标是类似像siri那样。
本文地址：https://segmentfault.com/a/11...

speech to text 可以为你的应用提供语音文本转录的能力。对非结构化信息的处理是Watson非常吸引人的地方，也使得他在众多人工智能服务中脱颖而出。因而，Watson对语音文字转化可以达到较高的可信度。

1.可以通过语音进行控制的应用，包括一些嵌入式设备，比如无人车，智能家电等。
2.视频或者语音电话会议。
3.一些通过语音可以进行的操作（用以解放双手），比如口述短信或邮件内容。

接口调用

该服务可以通过三种方法实现调用，通过WebSocket接口，或者REST接口，或者是异步HTTP接口。

输入

尽管使用三种不同的调用接口，但是三种方式共享相同的调用参数，只需要修改请求头的部分即可。

更详细的文档见API和输入参数说明

输出

输出以json格式返回，它将包括以下几方面内容：

我会在这篇文章中举例说明具体如何使用。

speech to text使用IBM语音合成技术，将文本内容语音化输出。

在一些由语音控制或者屏幕控制接口缺少（不存在）的应用场景下，该服务大有用武之地。通常包括：

接口调用

通过HTTP接口或者WebSocket接口，这和speech2text是一样的。

合成语音

HTTP GET方法，通过查询参数传递较短文本。

HTTP POST方法，在请求体中传递较长文本。

WebSockets

关注