weixin_47134119
码龄5年
关注
提问 私信
  • 博客:49,672
    社区:1
    49,673
    总访问量
  • 48
    原创
  • 677,453
    排名
  • 69
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2020-04-16
博客简介:

weixin_47134119的博客

查看详细资料
个人成就
  • 获得39次点赞
  • 内容获得29次评论
  • 获得319次收藏
  • 代码片获得586次分享
创作历程
  • 40篇
    2021年
  • 8篇
    2020年
成就勋章
TA的专栏
  • Azkaban
    1篇
  • hue
    1篇
  • flume
    1篇
  • SpringMvc组件
    1篇
  • SpringMVC请求
    1篇
  • SpringMVC响应
    1篇
  • 事务控制
    1篇
  • 配置文件映射
    2篇
  • 注解开发
    2篇
  • IOC
    1篇
  • Spring注解
    1篇
  • Bean依赖注入
    1篇
  • 加载策略
    1篇
兴趣领域 设置
  • 大数据
    hadoopsparketl
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

186人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

8.1.1 Flink快速应用【批量处理数据、实时流处理数据】

Flink快速应用文章目录Flink快速应用第 1 节 单词统计案例(批数据)1.1 需求1.2 代码实现通过一个单词统计的案例,快速上手应用Flink,进行流处理(Streaming)和批处理(Batch)第 1 节 单词统计案例(批数据)1.1 需求统计一个文件中各个单词出现的次数,把统计结果输出到文件步骤:1、读取数据源2、处理数据源a、将读到的数据源文件中的每一行根据空格切分b、将切分好的每个单词拼接1 c、根据单词聚合(将相同的单词放在一起)d、累加相同的单词(单词后面
原创
发布博客 2021.12.11 ·
3116 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

7.1.5 智慧物流【车辆监控Structured Streaming、整合kafka、Redis、Mysql、HBASE 写入数据】

车辆监控文章目录车辆监控第一节 Structured Streaming1.1 Structured Streaming发展历史1.1.1 Spark Streaming第一节 Structured Streaming1.1 Structured Streaming发展历史1.1.1 Spark Streaming
原创
发布博客 2021.11.18 ·
3253 阅读 ·
0 点赞 ·
0 评论 ·
9 收藏

7.1.4 智慧物流【实时数据采集,Kafka与nginx配置、java模拟车载传感采集数据发送到Kafka】

实时数据采集文章目录实时数据采集第一节 配置Nginx1、 安装git工具,安装wget下载工具2、切换到/usr/local/src目录,然后将kafka的 客户端源码使用git clone到本地3、进入librdkafka目录,对kafka客户端源码进行编译4、安装nginx 整合kafka的插件,进入到/usr/local/src目录下,使用git clone nginx整合kafka的源码5、下载nginx源码包6、进入到nginx的源码目录下(编译nginx,包含与kafka整合的插件)7、修
原创
发布博客 2021.09.23 ·
958 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

7.1.3智慧物流【指标统计,业务数据,快递单主题,运单主题(ETL,sqoop数据导出到MySql)】

指标统计文章目录指标统计第一节 指标体系第二节 业务数据1.1 物流系统数据库表揽件表(lg_collect_package)客户表(lg_customer)物流系统码表(lg_codes)快递单据表(lg_express_bill)客户地址表(lg_customer_address)网点表(lg_dot)公司表(lg_company)公司网点关联表(lg_company_dot_map)运单表(lg_waybill)线路表(lg_route)运输工具表(lg_transport_tool)转运记录表(
原创
发布博客 2021.09.16 ·
2651 阅读 ·
3 点赞 ·
0 评论 ·
14 收藏

7.1.1智慧物流【数据采集(sqoop)、ETL、数据导出】

智慧物流文章目录智慧物流一、项目整体架构二、数据采集第 1 节 数据说明第 2 节 业务数据第 3 节 同步数据到Hive3.1 离线数据采集3.1.1 第一次全量导入3.1.2 增量导入三、 数据ETL第 1 节 ODS->DWD1.1 lg_dwd.fact_orders--订单拉链表1.1.1 创建DWD层订单表1.1.2 订单拉链操作1.2 lg_order_items--订单明细表第 2 节 ODS-->DIM2.1 lg_dim.lg_items 商品表2.1.1 商品拉链表操作
原创
发布博客 2021.06.29 ·
2734 阅读 ·
7 点赞 ·
5 评论 ·
53 收藏

6.3.2 Spark GraphX【存储模式、核心数据结构、计算(图基本操作、连通图算法、寻找相同用户,合并)】

Spark GraphX文章目录Spark GraphX第1节 Spark GraphX概述第2节 Spark Grap2.1 GraphX 架构2.2 存储模式2.3 核心数据结构1、Graph2、vertices3、edges4、triplets第3节 Spark GraphX计算案例一:图的基本操作案例二:连通图算法案例三:寻找相同的用户,合并信息第1节 Spark GraphX概述GraphX 是 Spark 一个组件,专门用来表示图以及进行图的并行计算。GraphX 通过重新定义了图的
原创
发布博客 2021.06.14 ·
1685 阅读 ·
2 点赞 ·
4 评论 ·
10 收藏

6.3.1 Spark Streaming【DStream基础数据源、DStream转换操作、DStream输出操作、与kafka整合(08、010接口,offset偏移量)】

Spark Streaming文章目录Spark Streaming第1节 Spark Streaming概述第2节 DStream基础数据源2.1 文件数据流2.2 Socket数据流第1节 Spark Streaming概述第2节 DStream基础数据源基础数据源包括:文件数据流、socket数据流、RDD队列流;这些数据源主要用于测试。引入依赖: <dependency> <groupId>org.apache.spa
原创
发布博客 2021.06.09 ·
500 阅读 ·
2 点赞 ·
2 评论 ·
7 收藏

6.2.2 RDD编程高阶【序列化、依赖关系、持久化缓存、容错机制、分区、累加器、广播变量】、RDD编程优化、Shuffle原理

Spark Core文章目录Spark Core第4节 RDD编程高阶4.1 序列化4.2 RDD依赖关系再谈WordCount4.3 RDD持久化/缓存4.4 RDD容错机制Checkpoint第4节 RDD编程高阶Spark原理4.1 序列化在实际开发中会自定义一些对RDD的操作,此时需要注意的是:初始化工作是在Driver端进行的实际运行程序是在Executor端进行的这就涉及到了进程通信,是需要序列化的。可以简单的认为SparkContext代表Driver。packa
原创
发布博客 2021.05.18 ·
739 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

6.2.1 Spark Core(Spark概述、RDD编程【特点、RDD创建、Transformation(常见算子)、Key-ValueRDD操作】)

Spark Core文章目录Spark Core第1节 Spark概述1.1 什么是Spark1.2 Spark 与 Hadoop1.3 系统架构1.4 Spark集群部署模式1.5 相关术语第3节 RDD编程3.1 什么是RDD3.2 RDD的特点**1、分区****2、只读**3、依赖4、缓存5、checkpoint3.3 Spark编程模型第1节 Spark概述1.1 什么是SparkSpark是当今大数据领域最活跃、最热门、最高效的大数据通用计算引擎2009年诞生于美国加州大学伯克利
原创
发布博客 2021.05.16 ·
372 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Spark安装配置(本地模式、伪分布式、集群模式--standalone,yarn模式)

Spark安装配置文章目录Spark安装配置2.1 Spark安装2.2 本地模式2.3 伪分布式2.4 集群模式--Standalone模式2.4.1 Standalone 配置2.4.2 运行模式(cluster / client)2.1 Spark安装官网地址:http://spark.apache.org/文档地址:http://spark.apache.org/docs/latest/下载地址:http://spark.apache.org/downloads.html下载Spa
原创
发布博客 2021.05.07 ·
2003 阅读 ·
3 点赞 ·
1 评论 ·
7 收藏

6.1.2 Scala编程(特质trait、模式匹配和样例类、函数及抽象化、集合【Seq,Set,Map】/集合常用算子、与java集合转换、泛型参数、Akka)

Scala编程文章目录Scala编程第六部分 特质第1节 作为接口使用的特质第2节 带有具体实现的特质第3节 特质构造顺序第4节 特质继承类第5节 Ordered和Ordering第七部分 模式匹配和样例类第1节 模式匹配第2节 字符和字符串匹配第3节 守卫式匹配第4节 匹配类型第5节 匹配数组、元组、集合第6节 样例类第7节 Option与模式匹配第八部分 函数及抽象化第1节 函数字面量及函数的定义第2节 函数与方法的区别第3节 匿名函数与占位符第4节 高阶函数第5节 闭包第6节 柯里化第7节 部分应
原创
发布博客 2021.04.23 ·
1095 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

6.1.1 Scala编程(安装配置,基础语法,控制结构和函数,数组和元组,类与对象,继承)

Scala编程文章目录Scala编程第一部分 Scala基础第1节 Scala语言概况1.1 Scala语言起源1.2 Scala语言特点1.3 为什么要学Scala第2节 环境准备2.1 Windows下环境配置2.2 IDEA环境配置2.3 Scala的REPL第3节 基础语法第4节 常用类型与字面量第5节 类层次结构第6节 值与变量&自动类型推断第7节 操作符第8节 块表达式和赋值语句第9节 输入和输出第10节 字符串插值器第11节 对象相等性第二部分 控制结构和函数第1节 if 表达式第
原创
发布博客 2021.04.18 ·
260 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

5.2.2 电商离线数仓项目实战 【下】(任务调度系统Airflow)

电商离线数仓项目实战 【下】文章目录电商离线数仓项目实战 【下】第二部分 任务调度系统Airflow第1节 Airflow简介1.1、体系架构1.2、重要概念第2节 Airflow安装部署2.1、安装依赖2.2、Python环境准备2.3、安装Airflow2.4、创建数据库用户并授权2.5、修改Airflow DB配置第二部分 任务调度系统Airflow第1节 Airflow简介Airflow 是 Airbnb 开源的一个用 Python 编写的调度工具。于 2014 年启动,2015年春
原创
发布博客 2021.04.11 ·
612 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

5.2.1 电商离线数仓项目实战 【下】(电商分析-核心交易 :Mysql转入ODS层--全量导入、增量导入,维表、拉链表、周期性事实表,DIM、DWD、DWS、ADS层数据加载)

电商离线数仓项目实战 【下】文章目录电商离线数仓项目实战 【下】第一部分 电商分析之--核心交易第1节 业务需求第2节 业务数据库表结构第3节 数据导入3.1、全量数据导入第一部分 电商分析之–核心交易第1节 业务需求本主题是电商系统业务中最关键的业务,电商的运营活动都是围绕这个主题展开。选取的指标包括:订单数、商品数、支付金额。对这些指标按销售区域、商品类型进行分析。第2节 业务数据库表结构业务数据库:数据源交易订单表(trade_orders)订单产品表(order_pro
原创
发布博客 2021.04.09 ·
2269 阅读 ·
0 点赞 ·
0 评论 ·
17 收藏

5.1.2 电商离线数仓(广告业务)

电商离线数仓文章目录电商离线数仓一、电商分析之--广告业务第1节 需求分析第2节 事件日志采集第3节 ODS层建表和数据加载第4节 DWD层建表和数据加载4.1、DWD层建表4.2、事件json串解析4.3、DWD层数据加载第5节 广告点击次数分析5.1 需求分析**广告:ad****公共字段**5.2、创建ADS层表5.3、加载ADS层数据第6节 漏斗分析(点击率购买率)6.1、需求分析6.2、创建ADS层表6.3、加载ADS层数据第7节 广告效果分析7.1、需求分析7.2、创建ADS层表7.2、加载
原创
发布博客 2021.04.04 ·
1254 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

Tez安装和使用(Hive on Tez)

Hive on Tez文章目录Hive on Tez2.1、Tez概述2.2、安装部署Hortonworks在2014年左右发布了Stinger Initiative,并进行社区分享,为的是让Hive支持更多SQL,并实现更好的性能。让Hive的查询功能更强大。增加类似OVER子句的分析功能,支持WHERE子查询,以及调整Hive的样式系统更多的符合标准的SQL模型;优化Hive的请求执行计划,增加 Task 每秒处理记录的数量;引入新的列式文件格式(ORC文件),提供一种更现代、高效和高
原创
发布博客 2021.04.03 ·
980 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

DataX 安装及使用

DataX 安装及使用文章目录DataX 安装及使用一、DataX快速入门1.1、DataX概述及安装**概述**DataX安装配置1.2、DataX使用案例一、DataX快速入门1.1、DataX概述及安装DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步
原创
发布博客 2021.04.02 ·
448 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

5.1.1 电商离线数仓(数仓需求分析、日志采集、表数据加载、json数据处理、 Datax 数据导出、Tez高仿日启动测试)

电商离线数仓文章目录电商离线数仓一、电商离线数仓设计第1节 需求分析电商业务简介第2节 数据埋点第3节 数据指标体系第4节 总体架构设计4.1、技术方案选型框架选型**软件选型**服务器选型集群规模规划4.2、系统逻辑架构4.3、开发物理环境4.4、数据仓库命名规范二、 电商分析之--会员活跃度第1节 需求分析计算指标:指标口径业务逻辑:第2节 日志数据采集2.1、taildir source配置2.2、hdfs sink配置2.3、Agent的配置2.4、Flume的优化配置2.5、自定义拦截器
原创
发布博客 2021.04.04 ·
5587 阅读 ·
10 点赞 ·
9 评论 ·
101 收藏

4.2.5 Kafka集群与运维(集群的搭建、监控工具 Kafka Eagle)

Kafka集群与运维文章目录Kafka集群与运维1.集群的搭建1.1 搭建zookeeper集群1.1.1 上传JDK到linux,安装并配置JDK1.1.2. Linux 安装Zookeeper,三台Linux都安装,以搭建Zookeeper集群1.1.3.启动zookeeper1.2、Kafka集群搭建2.1 安装Kafka2.2 配置Kafka2.3 启动Kafka2.监控工具 Kafka Eagle2.1 需要Kafka节点开启JMX2.2 安装2.3 配置环境变量:1.集群的搭建搭建设
原创
发布博客 2021.03.23 ·
828 阅读 ·
0 点赞 ·
2 评论 ·
1 收藏

4.2.4 Kafka高级特性解析(物理存储、稳定性:事物,控制器,可靠性,一致性,_consumer_offsets、延时队列、自定义重试队列)

Kafka高级特性解析文章目录Kafka高级特性解析2.5 物理存储2.5.1 日志存储概述2.5 物理存储2.5.1 日志存储概述Kafka 消息是以主题为单位进行归类,各个主题之间是彼此独立的,互不影响。每个主题又可以分为一个或多个分区。每个分区各自存在一个记录消息数据的日志文件。图中,创建了一个 tp_demo_01 主题,其存在6个 Parition,对应的每个Parition下存在一个[Topic-Parition] 命名的消息日志文件。在理想情况下,数据流量分摊到各个 Pa
原创
发布博客 2021.03.23 ·
927 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多