自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

随风不随水的博客

原创 java调用第三方api接口获取数据

弊端，但是并不是每个接口都适用于这套模板，之前写的接口不适用，都是在这个模板里做了定制处理（if 特殊表 -》处理），需要考虑兼容之前的代码，这种兼容代码，有风险会改掉之前的逻辑个人喜欢，有一个接口，写一段代码灵活自由些。2.还有一部分是对post请求的返回数据，做处理，因为json返回的格式如果双方没有约定好，里面数据是多层json嵌套，需要做处理。江同事交接的就是这个代码模板，可以看下源码调试一下，之前交接的视频，也可以看下，主要还是看代码理解快些，将写好的代码达成jar包，上传到linux上去，

2024-01-17 15:13:55 1045

原创部署大数据组件，问题过程记录

init_iVAP_nacos.sql脚本库名为 nacos 两者实为共用一个库。原因：数据库挂了，重启数据库重启nacos 重启可视化组件。查看日志报错显示 jdk版本过低，重新安装jdk新版本。nacos初始化脚本库名为nacos_config。这是由于提供的数据配置初始化sql脚本不一样，加上 -O CP936。

2024-01-17 12:58:47 404

原创数据治理通用方案（中）

数据治理设计方案

2024-01-12 15:48:13 1582 1

原创数据治理通用方案（上）

数据治理方案设计

2023-12-28 17:24:00 1543 1

原创解决：10亿条数据，分区太多，T级数据量，数据执行失败

背景：最近想要抽出日志数据（1.3T左右），统计商品的pv，uv，收藏，加车，分享，销售数等等，根据这些信息加权，用于商品推荐。查看sparkui界面，发现数据分布在各台机器上比较均匀，但是shuffle read时间太长在查表时，执行不出来，我推测是由于分区数太多引起，并且数据量太大。解决：1.将数据按天去抽取到一张中间表里（1）可以建立一张表，不带分区，里面包含所有天的数据，然后where ds 按月 insert into 到表中，例如 ds >= 2020-01-01 and ds

2020-12-24 17:35:16 1054 1

原创 hive数据倾斜，非复制粘贴，确切实用

最近做宽表，insert overwrite table … select导入数据时，发生了数据倾斜情况通过ui界面看到，有一半的数据，都跑在了单个节点上，执行的时候，报错，11.3G超出物理内存限制的11G。百度搜了一下，hive数据倾斜，全部都是复制粘贴。。。内容都是那几句，空值过滤，设置mapjoin，负载均衡，空值时随机数分配，预聚合，上面该操作的，我都操作过了，依然无法解决。排查–引起数据倾斜的key我的解决方案是，首先找出产生数据倾斜的key值，在sparkUI界面上，看执行情况，

2020-12-11 17:56:11 202 1

截图工具，可编辑，可修改

快速截图，快捷键截图。

2020-05-08

web开发--网上花店

网站开发，主题花店。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

2018-06-21

吃豆子游戏

用C++编程语言编写，简单吃豆子游戏。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

2017-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

随风不随水 CSDN认证博客专家 CSDN认证企业博客

码龄7年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

6: 原创

30万+: 周排名

18万+: 总排名

5835: 访问

: 等级

134: 积分

49: 粉丝

72: 获赞

4: 评论

80: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据治理通用方案（中）
CSDN-Ada助手: 恭喜作者持续创作，文章内容扎实，深入浅出，让人受益匪浅。在下一步的创作中，或许可以考虑加入一些案例分析或者实践经验，以丰富读者的阅读体验，期待作者更多精彩的作品。谢谢！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
数据治理通用方案（上）
CSDN-Ada助手: 恭喜作者发布了新的博客文章！数据治理通用方案是一个非常重要的话题，你的文章内容很有价值。希望你能继续分享更多关于数据治理的见解，也可以考虑结合实际案例来分析和讨论，这样能够更加深入地理解和应用数据治理的通用方案。期待你的下一篇文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
解决：10亿条数据，分区太多，T级数据量，数据执行失败
不吃西红柿丶: 大佬，以后跟你混了！
hive数据倾斜，非复制粘贴，确切实用
ctotalk: 感谢分享，学以致用。

最新文章

提示

确定要删除当前文章？

取消删除