FlinkSql解析复杂的JSON结构

之前的一篇文章介绍了FlinkSQL解析Pulsar中的JSON结构数据,这次来描述一下如果遇到比较复杂的JSON,应该如何处理。我所使用的Flink的版本为v1.12。

一、处理思路

  1. 使用原生的FlinkSQL,使用对象解析的方式,进行解析处理。
  2. 使用FlinkUDF方式进行解析,如果不是特别特别复杂的JSON,不建议使用,有可能会对性能有影响。该方法不详细介绍。

二、使用原生的FlinkSQL具体实现

1.分析JSON的结构

{
    "cityId":"1",
    "cityCode":"1",
    "values":[
        {
            "id":"1_0",
            "deviceId":"1_0",
            "value":{
                "createTime":"1658368497581",
                "value":"1.1",
                "desc":"值为1.1"
            }
        },
        {
            "id":"1_1",
            "deviceId":"1_1",
            "value":{
                "createTime":"1658368497582",
                "value":"1.1",
                "desc":"值为1.1"
            }
        }
    ]
}

JSON结构为示例,此处先不考虑JSON的结构是否合理,只考虑如何解析。

2.在SQL中定义解析对象

注意观察SQL中定义的结构,一定要和JSON的结构匹配

CREATE TABLE t_in
(
    cityId   string,
    cityCode string,
    `values` ARRAY<ROW<
	    id STRING,
	    deviceId STRING,
	    `value` ROW<
		    createTime STRING,
		    `value` STRING,
		    `desc` STRING>>>
) WITH (
      'connector' = 'pulsar',
      'generic' = 'true',
      'topic' = 'persistent://public/default/test',
      'service-url' = 'pulsar://127.0.0.1:6650',
      'admin-url' = 'http://127.0.0.1:8080',
      'scan.startup.mode' = 'external-subscription',
      'scan.startup.sub-name' = 'test',
      'scan.startup.sub-start-offset' = 'earliest',
      'format' = 'json');

3.解析并获取需要的属性字段

List中嵌套的对象,可以用<对象.属性>的方式获取。'connector'可自行定义。
Sql中一些函数的用法可以参考官网

CREATE TABLE t_out
(
    cityId     string,
    cityCode   string,
    id         string,
    deviceId   string,
    createTime string,
    `value`    string,
    `desc`     string
) WITH (
      'connector' = 'print'
      );

INSERT INTO t_out
SELECT cityId,
       cityCode,
       id,
       deviceId,
       `value`.createTime as createTime,
       `value`.`value`    as `value`,
       `value`.`desc`     as `desc`
FROM t_in
         CROSS JOIN UNNEST(`values`) AS t(id, deviceId, `value`);
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在Flink SQL中,解析JSON的函数有以下几种: 1. JSON_VALUE:用于从JSON字符串中提取指定的值。 2. JSON_OBJECT:用于创建一个JSON对象。 3. JSON_ARRAY:用于创建一个JSON数组。 4. JSON_PARSE:用于将JSON字符串解析JSON对象或JSON数组。 5. JSON_EXISTS:用于检查JSON字符串中是否存在指定的键或路径。 6. JSON_PRETTY:用于将JSON字符串格式化为易于阅读的形式。 以上是Flink SQL解析JSON的常用函数,可以根据具体需求选择使用。 ### 回答2: 在Flink SQL中,解析JSON数据的函数被称为JSON函数,它允许用户将JSON格式的数据解析Flink SQL查询所需的格式。 在Flink SQL中,用户可以使用JSON函数将一个JSON字符串转换为一个Flink SQL的ROW类型,这个ROW类型包含了JSON中所有的key和value。此外,用户还可以使用JSON函数将Flink SQL的ROW类型转换为JSON字符串。 在利用JSON函数解析JSON数据之前,需要先将JSON数据定义为Flink SQL的源表,这可以使用CREATE TABLE语句来完成。在CREATE TABLE语句中,用户需要指定JSON数据所在的路径以及JSON数据中各个字段的名称和数据类型。 接下来,用户可以利用SELECT语句来解析JSON数据。在SELECT语句中,用户可以使用JSON函数来解析JSON数据,并且可以使用标准的SQL语法来查询JSON数据中的某些字段。 以下是JSON函数的一些常用语法: 1. JSON_OBJECT(str*):返回一个JSON对象,这个对象中包含了所有给定的key-value对。 2. JSON_ARRAYAGG(expr):将expr转化成一个JSON数组。 3. JSON_OBJECTAGG(key, value):返回一个JSON对象,这个对象中包含了所有给定key-value对。 4. JSON_EXTRACT(json, path):返回一个给定JSON对象中指定path的值。 5. JSON_ARRAY(expr1, expr2, …):返回一个指定的JSON数组。 总结一下,在Flink SQL中,利用JSON函数解析JSON数据的流程如下: 1. 将JSON数据定义为Flink SQL的源表。 2. 在SELECT语句中使用JSON函数来解析JSON数据。 3. 使用标准的SQL语法查询JSON数据中的某些字段。 最后,需要注意的是,Flink SQL中的JSON函数文档已经非常详细,用户可以按需查阅。此外,Flink SQL官方文档中还提供了很多例子,用户可以参考这些例子来学习如何使用JSON函数。 ### 回答3: FlinkSQL是Apache Flink中的一种SQL分析工具,通过使用FlinkSQL可以快速地对数据进行分析和处理。在FlinkSQL中,解析JSON是一项常见的任务,这可以通过使用解析JSON的函数来实现。 在FlinkSQL中,解析JSON的函数包括:JSON_VALUE、JSON_OBJECT、JSON_ARRAY等。其中,JSON_VALUE函数用于从JSON字符串中提取特定的值,JSON_OBJECT函数用于创建一个JSON对象,而JSON_ARRAY函数用于创建JSON数组JSON_VALUE函数的语法是: JSON_VALUE(json, path) 其中,json参数指的是要解析JSON字符串,path参数则是JSON路径表达式。示例: SELECT JSON_VALUE('{"name":"xiaoming","age":18}','$.age') as age 这将返回18,因为它从JSON字符串中选择了“age”值。 JSON_OBJECT函数的语法是: JSON_OBJECT(key1, value1, key2, value2, …) 其中,key和value是JSON中的键值对。示例: SELECT JSON_OBJECT('name', 'xiaoming', 'age', 18) as user 这将返回一个包含'name'为'xiaoming','age'为18的JSON对象。 JSON_ARRAY函数的语法是: JSON_ARRAY(value1, value2, ...) 其中,value可以是任何JSON数据类型,例如字符串、数字、对象或数组。示例: SELECT JSON_ARRAY('xiaoming', 'xiaohong', 'xiaobai') as users 这将返回包含三个字符串值的JSON数组。 总的来说,FlinkSQL中的解析JSON函数提供了一种简单而灵活的方法来解析JSON数据。使用这些函数,可以轻松地从JSON字符串中提取所需的数据,并将其转换为其他格式进行进一步处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值