自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 hive中的优化

hive的优化

2023-02-18 10:39:53 167

转载 flink中的事件时间和水印

Flink的数据源在确认所有小于某个时间戳的消息都已输出到Flink流处理系统后,会生成一个包含该时间戳的WaterMark,插入到消息流中,输出到Flink流处理系统中,Flink算子按照时间窗口缓存所有流入的消息。比如:某数据源中的某些数据由于某种原因(如:网络原因,外部存储自身原因)会有2秒的延时,也就是在实际时间的第1秒产生的数据有可能在第3秒中产生的数据之后到来。+ "|水位线时间戳: "+ wm + ","+ format.format(wm.getTimestamp()));

2023-01-01 17:03:55 866 1

原创 关于大数据的一些简答

MapReduce mapTask reduceTask hive

2022-11-10 22:59:50 598

原创 Spark SQL 与 HIVE异同

hive spark

2022-11-10 14:49:41 1444 2

原创 对比目前流行的几个大数据查询引擎:Hive、SparkSQL、Presto、Impala、HAWQ、 ClickHouse、Greenplum。

大数据仓库

2022-10-02 15:54:01 1844 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除