百度语义理解开放平台面向互联网开发者提供自然语言文本的解析服务,也就是可以根据文本的意图解析成相应的表示。
为了易于人阅读,同时也方便机器解析和生成,意图表示协议采用 json 语言进行描述,采用 gb18030 编码。
json 语言的基本概念:
1、属性名/属性值
即键值对(key-value)
2、数组
在 json 中是“[]”括起来的内容,数据结构为 ["value1","value2",...],取值方式和所有语言中一样,使用索引获取,属性值的类型可以是数字、字符串、数组、对象。
3、对象
在 json 中表示为“{}”括起来的内容,数据结构为 {key1:value1,key2:value2,...}的键值对的结构。在面向对象的语言中,key 为对象的属性,value 为对应的属性值,所以很容易理解,取值方法为对象.key 获取属性值,这个属性值的类型可以是数字、字符串、数组、对象几种。
自然语言文本(以下简称 query)。query 的意图表示由如下键值对和数组构成:
1、raw_text:用户的原始输入文本
2、parsed_text:经过分词,纠错,改写处理后的文本
3、version:协议版本号
4、results:意图表示数组
从服务器中得到的json数据就是按照这样的几个部分组成的,例如 “北京天气”对应的json结构如下
- query:北京明天天气
- {
- "raw_text":"北京明天天气",
- "parsed_text":"北京 明天 天气",
- "results":[