自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

夫唯不争，故天下莫能与之争。

属于你的东西，你就要努力去争取。微信公众号【数据空间站】

12月 11月 10月 09月 08月 07月 05月 04月 03月 01月

转载 in 和 exist 区别

select * from Awhere id in(select id from B)以上查询使用了in语句,in()只执行一次,它查出B表中的所有id字段并缓存起来.之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录. 它的查询过程类似于以下过程 List resultSet=[]; Array A=(select * f

2016-08-30 23:38:04 717

原创 Hive的Collect函数

有以下表 id name 1001 A 1001 B 1001 C实现以下功能 id name 1001 A,B,C即按照id 进行group by，将每个id的name组成一个list放到name字段中。select id,collect_list(name) from table group by id若name中有重复的值，可以用collect_

2016-08-24 09:22:59 28005

原创 Spark概述

概述:ApacheSpark™ is a fast and general engine for large-scale data processing.如官网所说，Spark是快速处理大规模数据的引擎，对应的Hadoop的MR引擎我们听到的Spark比Hadoop快100倍，其实是比MR快，MR将数据的中间结果写入磁盘，而Spark则是直接写入内存，在一定程度上，加速了程序的处理。

2016-08-01 20:41:27 951

Python经典复习题

列出了Python初学者的基础练习题，有助于Python初学者掌握基础语法知识

2014-05-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄11年

162
原创

201
点赞

373
收藏

123
粉丝

关注

私信

热门文章

分类专栏

最新评论

一文搞懂Flink内部的Exactly Once和At Least Once
黑暗骑士李崛起: 大佬🐮
The file LOG/STDOUT is not available on the TaskExecutor
老胡向前冲: 大佬，你说的这个到底怎么设置的呢？于是手动在程序中参考 YarnLogConfigUtil.discoverLogConfigFile方法设置 $internal.yarn.log-config-file 参数，最终日志成功出现！有示例吗？
The file LOG/STDOUT is not available on the TaskExecutor
li1796821762: flink operator1.16跑在kubernetes里，是application模式，报这个错，应该修改哪个文件啊？求解
Python制作微信聊天机器人
你好科技城: 怎么用
The file LOG/STDOUT is not available on the TaskExecutor
sinat_27054329: 大佬，docker下这个这个问题怎么解决知道么，很多办法都不行，flink1.14跑在kubernetes里standalone-application模式

提示

确定要删除当前文章？

取消删除