自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(163)
  • 收藏
  • 关注

原创 API响应状态

API响应状态

2022-12-05 17:49:33 271 1

原创 支持注册API类型

支持注册API类型

2022-12-05 17:22:08 211

原创 术语与定义

术语与定义

2022-12-05 17:01:56 254

原创 ES的使用

ES的使用

2022-08-22 10:52:12 148

原创 违法行为分析1

违法行为分析

2022-07-06 17:01:52 307

原创 事故指标统计

事故指标统计

2022-07-05 15:20:56 573

原创 数据准备工作

数据准备工作

2022-07-04 21:40:22 2238

原创 checkpoint

checkpoint

2022-06-17 19:56:29 249

原创 缓存cache

缓存cache

2022-06-16 21:48:29 333

原创 mapPartitions

mapPartitions

2022-06-16 20:10:49 196

原创 常用的算子1

常用的算子

2022-06-15 20:30:54 78

原创 Kafka的使用

Kafka的使用

2022-06-15 09:47:12 109

原创 Kafka的搭建

Kafka的搭建

2022-06-14 22:01:54 116

原创 自定义MySQL Source

自定义MySQL Source

2022-06-13 20:09:01 244

原创 Spark跟Flink的区别、常见的Source

Spark跟Flink的区别、常见的Source

2022-06-13 19:25:26 117

原创 位置数据融合表3

位置数据融合表

2022-06-10 20:38:31 125

原创 Flink开发环境搭建及WordCount

Flink开发环境搭建及WordCount

2022-06-10 20:24:52 167

原创 在时间轴上进行聚类

在时间轴上进行聚类

2022-06-08 20:24:46 249

原创 位置数据融合表2

位置数据融合表

2022-06-07 20:05:52 303

原创 位置数据融合表1

位置数据融合表

2022-06-06 21:12:05 136

原创 开发环境搭建

开发环境搭建

2022-06-01 20:26:17 214

原创 CRM数据采集

CRM数据采集

2022-05-31 22:06:43 460

原创 DataX安装

DataX安装

2022-05-31 21:22:31 114

原创 采集OIDD数据

[ods@master ~]$ mkdir ctyun[ods@master ~]$ lsctyun students.txt[ods@master ~]$ cd ctyun/[ods@master ctyun]$ ls[ods@master ctyun]$ pwd/home/ods/ctyun[ods@master ctyun]$ mkdir oidd[ods@master ctyun]$ cd oidd/[ods@master oidd]$ ls[ods@master oidd].

2022-05-31 20:32:46 695

原创 flume安装配置

[root@master soft]# vim /etc/profilealias soft='cd /usr/local/soft/'[root@master soft]# source /etc/profile[root@master soft]# soft[root@master soft]# cd ~[root@master ~]# pwd/root[root@master ~]# soft[root@master soft]# pwd/usr/local/soft[.

2022-05-31 20:00:54 89

原创 权限的控制

[root@master ~]# cd /usr/local/soft/hadoop-2.7.6/[root@master hadoop-2.7.6]# lsbin include libexec logs README.txt shareetc lib LICENSE.txt NOTICE.txt sbin tmp[root@master hadoop-2.7.6]# cd etc/[root@master etc]# lshado.

2022-05-31 15:47:45 303

原创 大数据项目流程

大数据项目流程

2022-05-30 14:50:06 137

原创 人体的指标

<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-mllib_2.11</artifactId> <version>2.4.5</version></dependency>package com.shujia.mllibimport org.apache.spark.ml.{featur..

2022-05-25 21:08:51 85

原创 StructuredStreaming

package com.shujia.streamingimport org.apache.spark.sql.streaming.OutputModeimport org.apache.spark.sql.{DataFrame, SaveMode, SparkSession}object Demo05StructuredStreaming { def main(args: Array[String]): Unit = { //创建SparkSession val spar.

2022-05-24 10:58:47 85

原创 缉查布控操作

package com.shujia.streamingimport org.apache.spark.broadcast.Broadcastimport org.apache.spark.sql.SparkSessionimport org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}import org.apache.spark.streaming.{Durations, StreamingContext}...

2022-05-20 21:11:26 288

原创 滑动窗口操作

package com.shujia.streamingimport org.apache.spark.sql.SparkSessionimport org.apache.spark.streaming.dstream.DStreamimport org.apache.spark.streaming.{Durations, StreamingContext}object Demo03Window { def main(args: Array[String]): Unit = { /.

2022-05-20 19:22:30 262

原创 Action算子、Pi

package com.shujia.coreimport com.shujia.core.Demo10Join.Studentimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.rdd.RDDobject Demo16Action { def main(args: Array[String]): Unit = { //常见的Action算子 //foreach take col.

2022-05-19 21:24:00 191

原创 aggregateByKey

aggregateByKey

2022-05-19 20:02:40 245

原创 有状态算子

package com.shujia.streamingimport org.apache.spark.sql.SparkSessionimport org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}import org.apache.spark.streaming.{Durations, StreamingContext}object Demo01WordCountOnStreaming { d...

2022-05-19 16:28:16 233

原创 SparkStreaming介绍及开发环境搭建

<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>2.4.5</version></dependency>package com.shujia.streamingimport org.apache.spa...

2022-05-19 11:17:34 461

原创 GroupByKey VS ReduceByKey

package com.shujia.coreimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object Demo11Cartesian { def main(args: Array[String]): Unit = { //创建Spark Context val conf: SparkConf = new SparkConf() conf.setAppN.

2022-05-18 20:48:02 290

原创 决定RDD分区数因素、关联

package com.shujia.coreimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.rdd.RDDobject Demo09Union { def main(args: Array[String]): Unit = { //创建Spark Context val conf: SparkConf = new SparkConf() conf.setAppName(.

2022-05-18 19:59:14 297

原创 SparkOnHive

package com.shujia.sqlimport org.apache.spark.sql.expressions.Windowimport org.apache.spark.sql.{DataFrame, SparkSession}object Demo06SparkOnHive { def main(args: Array[String]): Unit = { /** * 通过enableHiveSupport()可以开启Hive的支持 * 需要在po.

2022-05-18 11:03:47 302

原创 Spark SQL写代码的几种方式

package com.shujia.sqlimport org.apache.spark.sql.expressions.Windowimport org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}object Demo04DSL { def main(args: Array[String]): Unit = { val spark: SparkSession = SparkSession .buil.

2022-05-18 10:25:56 876

原创 Burks练习题、JD Log练习题

公司代码,年度,1月-------------------------12月的收入金额burk,year,tsl01,tsl02,tsl03,tsl04,tsl05,tsl06,tsl07,tsl08,tsl09,tsl10,tsl11,tsl12853101,2010,100200,25002,19440,20550,14990,17227,40990,28778,19088,29889,10990,20990853101,2011,19446,20556,14996,17233,40996,2..

2022-05-17 17:00:10 222

各行业的数据中台需求特征

各行业的数据中台需求特征

2024-04-28

数据中台的数据体系架构

数据中台的数据体系架构

2024-04-28

数据中台项目主要岗位及其职责和任务

数据中台项目主要岗位及其职责和任务

2024-04-28

数据中台工程化交付任务分工及产出物

数据中台工程化交付任务分工及产出物

2024-04-28

数据中台工程化交付RACI矩阵

数据中台工程化交付RACI矩阵

2024-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除