json
文章平均质量分 72
for your wish
好记性不如烂笔头。个人笔记用的博客
展开
-
三十:Kakfa模拟Json数据生成和发送
在计算 PV 和 UV 的过程中关键的一个步骤就是进行日志数据的清洗。实际上在其他业务,比如订单数据的统计中,我们也需要过滤掉一些“脏数据”。所谓“脏数据”是指与我们定义的标准数据结构不一致,或者不需要的数据。因为在数据清洗 ETL 的过程中经常需要进行数据的反序列化解析和 Java 类的映射,在这个映射过程中“脏数据”会导致反序列化失败,从而使得任务失败进行重启。在一些大作业中,重启会导致任务不稳定,而过多的“脏数据”会导致我们的任务频繁报错,最终彻底失败。架构提过整个 PV 和 UV 计原创 2022-02-26 11:28:37 · 363 阅读 · 0 评论 -
Spark/Hive如何解析嵌套Json
Hive解析嵌套Json用get_json_object数据是string类型,拆分的时候get_json_object的逗号后要加个空格{"KdProjCode":"A20160518015NB","DTjType":"调价","xmlns:xsi":"http://www.w3.org/2001/XMLSchema-instance","PriceHzInfo":{"Item":{"HzAmountAfter":1.0190920349E10,"HzAmountBefore":1.019080原创 2022-02-25 18:21:39 · 2317 阅读 · 0 评论 -
Spark获取json写入hive(工作实例)
spark-submit \--executor-memory 8G \--conf spark.target.date=${dt} \--conf spark.ui.retainedTasks=50000 \--driver-memory 4G \--master yarn \--class com.cifi.zhyc.SparkImportMcYanPan\--deploy-mode client \{JsonSpark.jar} \package com.cifi.zhyc.原创 2021-09-07 17:15:06 · 681 阅读 · 0 评论 -
获取json中数据和json数组根据其中一个属性进行分类重组
String a="{'code':100,'data':{'grdbl':100.0,'bxl':646,'fwl':0,'mytsl':0}}"; //先把String对象转换成json对象 JSONObject object=JSONObject.fromObject(a); System.out.println(object.get("code")); System.out.println(object.getJSONObj...原创 2020-05-09 19:10:36 · 1560 阅读 · 0 评论