自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 微信小程序——云音乐界面

swiper常用属性:可选值说明默认Boolean是否显示面板指示点,默认为falseColor指示点颜色,默认为rgba(0,0,0,.3)Color当前选中的指示点颜色,默认为#000000autoplayBoolean是否自动切换,默认为falsecurrentNumber当前所在滑块的index,默认为0String当前所在滑块的item-id(不能同时指定current)intervalNumber自动切换时间间隔(毫秒),默认为5000。

2022-12-10 23:33:21 15761 2

原创 瑞吉外卖项目实战

(四)创建应用属性文件在resources目录下创建应用属性文件 - application.yml配置application.yml查看项目启动页面log对象的五个方法WebMvcConfig继承WebMvcConfigurationSupport类重写addResourceHandlers方法打印静态资源映射测试项目查看静态资源映射启动应用在浏览器输入localhost:8080/backend/index.html,访问后端首页访问前端图片资源四 后台登录

2022-10-02 16:42:03 17046 4

原创 数仓建模理论

实际上,INF是所有关系型数据库的最基本要求,你在关系型数据库管理系统(RDBMS),列如SQL Server,Oracle,MySQL中创建数据表的时候,如果数据表的设计不符合这个最基本的要求,那么操作一定是不能成功的。1、完全函数依赖:设X,Y是关系R的两个属性集合,X是X的真子集,存在x→Y,但对每一个X都有X’!设X,Y是关系R的两个属性集合,X是X的真子集,存在x→Y,但对每一个X都有X‘!从属型数据集市的优点:搭建一个从属型数据集市开发周期是比较长的,首先必须要有一个中央的数据仓库。

2022-09-05 22:50:36 1587

原创 kafka 下载安装

传统的消息队列的主要应用场景包括:缓存/消峰、解耦和异步通信。缓冲/消峰:有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。解耦:允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。异步通信:允许用户把一个消息放入队列,但并不立即处理它,然后在需要的时候再去处理它们3、修改解压后的文件名称5、分发安装包中的 broker.id=1、broker.id=2slave1slave2(3)分发环境变量文件到其他节点,并 source

2022-07-11 22:07:29 2517

原创 Spark SQL案例:统计每日新增用户

现需要根据上述数据统计每日新增的用户数量,期望统计结果即2022-01-01新增了3个用户(分别为mike、alice、brown),2022-01-02新增了1个用户(green),2022-01-03新增了两个用户(分别为smith、brian)。预备工作:启动集群的HDFS与Spark...

2022-07-08 01:13:01 869

原创 Spring Boot +ECharts 案例

Spring Boot + Echarts 案例演示

2022-06-23 15:17:10 805

原创 Zookeeper 下载安装

zookeeper安装搭建启动master启动slave1启动slave2查看master查看slave1查看slave2(2)增加脚本执行权限

2022-06-19 20:33:44 2207

原创 Spark SQL 数据加载和保存

format(“…”):指定加载的数据类型,包括"csv"、“jdbc”、“json”、“orc”、"parquet"和“textFile”。load(“…”):在"csv"、“jdbc”、“json”、“orc”、"parquet"和"textFile"格式下需要传入加载数据的路径。option(“…”):在"jdbc"格式下需要传入 JDBC 相应参数,url、user、password 和 dbtable我们前面都是使用 read API 先把文件加载到 DataFrame 然后再查询,其实

2022-06-19 01:58:53 1056

原创 Spark RDD交互式案例统计每日新增长用户

现需要根据上述数据统计每日新增的用户数量,期望统计结果:预备工作:启动集群的HDFS与Spark在虚拟机创建user.txt文件将user.txt上传到HDFS/input目录下执行spark-shell命令二、完成任务(一)读取文件,得到RDD执行命令:val rdd = sc.textFile(“hdfs://master:9000/input/user.txt”)...

2022-06-18 23:47:06 256

原创 Spark RDD案例:统计每日新增用户

现需要根据上述数据统计每日新增的用户数量,期望统计结果即2022-01-01新增了3个用户(分别为mike、alice、brown),2022-01-02新增了1个用户(green),2022-01-03新增了两个用户(分别为smith、brian)。预备工作:启动集群的HDFS与Spark在虚拟机创建user.txt文件将user.txt上传到HDFS/input目录下二、完成任务(一)新建Maven项目设置项目类型scala 目录(用的以前的gif不会影响)(二

2022-06-17 20:31:23 297

原创 Spark SQL案例 计算平均分

Django成绩表 -django.txtSpark成绩表 -spark.txt预备工作:启动集群的HDFS与Spark在HDFS上新建/score目录在master虚拟机上新建一个file文件,在file创建三个成绩文件将文件上传到hdfs上的score目录下查看文件内容二、完成任务(一)新建Maven项目设置项目类型scala目录(用的以前的gif不会影响)(二)添加相关依赖和构建插件在pom.xml 添加依赖...

2022-06-17 15:07:02 470

原创 Spark RDD

执行命令:val rdd = sc.textFile(“file:///home/test.txt”)执行命令:val lines = rdd.collect(),查看RDD中的内容,保存到常量lines执行命令:lines.foreach(println)(利用foreach遍历算子)执行命令:for (line

2022-06-16 23:55:46 1254

原创 Spark SQL案例:分组排行榜

查看mysql数据表t_score预备工作:启动集群的HDFS与Spark

2022-06-16 16:30:17 336

原创 Scala

2、案例(二)变量和常量常量:在程序执行的过程中,其值不会被改变的变量1、基本语法var 变量名 [: 变量类型] = 初始值 var i:Int = 10val 常量名 [: 常量类型] = 初始值 val j:Int = 20注意:能用常量的地方不用变量2、案例var 变量val 常量(三)标识符Scala 对各种变量、方法、函数等命名时使用的字符序列称为标识符。即:凡是自己可以起名字的地方都叫标识符。1、命名规则(四)数据类型在Scala中,

2022-06-16 08:14:00 970

原创 Spark RDD案例:词频统计

(二)创建日志属性文件在资源文件夹里创建日指数型文件 - log4j.properties(三)创建词频统计单例对象在net.huawei.rdd包里创建WordCount单例对象查看结果

2022-06-15 17:37:05 1194

原创 Spark RDD案例:分组排行榜

同一个学生有多门成绩,现需要计算每个学生分数最高的前3个成绩,期望输出结果如下所示:预备工作:启动集群的HDFS与Spark本地上传文本grades.txt 到hdfs在hdfs上查看grades.txt内容二、完成任务(一)新建Maven项目设置项目信息增加目录scala(二)添加相关依赖和构建插件在pom.xml添加依赖(五)本地运行程序,查看结果在控制台查看输出结果(六)使用交互式方法1、使用spark-shell2、读取hdfs上的文

2022-06-15 17:14:38 505

原创 Spark运行环境搭建

(2)启动Local环境进入解压缩后的路径,执行一下命令

2022-06-07 23:26:46 2957

原创 JAVA初级基础

Java 基础

2022-06-06 20:05:14 451

原创 Spark SQL

Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。在 Spark 中,DataFrame 是一种以 RDD 为基础的分布式数据集,类似于传统数据库中 的二维表格。DataFrame 与 RDD 的主要区别在于,前者带有 schema 元信息,即 DataFrame 所表示的二维表数据集的每一列都带有名称和类型。这使得 Spark SQL 得以洞察更多的结构 信息,从而对藏于 DataFrame 背后的数据源以及作用于 DataFrame 之上的变换

2022-06-05 18:52:18 516

原创 Spring Boot

启动项目,访问http://lcoalhost:8080/welcome

2022-06-05 16:51:17 647

原创 spring容器

创建Maven项目 - SpringDemo,设置项目位置以及组ID单击.[Finsh]按钮修改maven位置打开Maven窗口单击刷新按钮,就开始下载依赖包插件与依赖下载完成(三)创建杀龙任务创建net.cch.spring.day01包,然后在包里面创建SlayDragonQuest类下面展示一些 。(四) 创建勇敢骑士类net.cch.spring.day01包里创建BraveKnight类(五)采用传统的方式然勇敢骑士完成杀龙任务net.cch.spri

2022-06-04 23:26:23 96

原创 SSM框架实现用户登录功能

目录一、利用SSM框架实现用户登录(一)创建数据库与表1、创建数据库2、创建用户表3、用户添加记录 (二)、创建Maven项目(三) 、添加相关依赖 (4)、创建日志属性文件(5)创建数据库配置属性文件(六)给项目添加Web功能(七)配置Tomcat服务器1、安装Tomcat服务器2、 启动Tomcat服务3、访问Tomcat主页4、项目配置Tomcat服务器(8) 用户实体类(九)创建用户映射器接口(十)创建用户服务类(十一)创建用户控制器(十二)创建用户映射器配置文件(十三)准备静态资源1、准备图片资源

2022-06-04 19:15:06 939

原创 大数据技术之Hadoop

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录第一章 大数据概述1.大数据概念大数据(Big Data) :指无去在一定时间范围内用常规软件工具进行捕捉、管理和处理的数居集合,是需要新处理模式才能具有更强的央策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。主要解决,海量数据的存储....

2022-05-22 14:47:18 4816

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除