- 博客(23)
- 收藏
- 关注
原创 Spark SQL的总结
Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象结构叫做DataFrame的数据模型(即带有Schema信息的RDD),Spark SQL作为分布式SQL查询引擎,让用户可以通过SQL、DataFrames API和Datasets API三种方式实现对结构化数据的处理。
2024-05-16 19:32:03 640 1
原创 Spark RDD结课总结
生成的RDD中保存的是T的值,Seq[String]部分的数据会按照Seq[(T,Seq[String])]的顺序存放到各个分区中,一个Seq[String]对应存放至一个分区,并为数据提供位置信息,通过preferredLocations()方法可以根据位置信息查看每一个分区的值。reduceByKey()方法,一种转换操作,用于合并具有相同键的值,作用对象是键值对,并且只对每个键的值进行处理,当RDD中有多个键相同的键值对时,则会对每个键对应的值进行处理。RDD的创建有3种不同的方法。
2024-05-16 19:31:31 862
原创 Echarts“无人售货机”大屏展示 项目分析
无人售货机信息表数据的预处理与建模完成后,从无人售货机销售的。个方向对预处理和建模后的数据进行可视化展现与分析。整体情况、销售情况、库存情况和用户情况。总数据:charts.total.js。销售分析:charts.sale.js。用户分析:charts.user.js。库存分析:charts.int.js。展示不同地点无人售货机的总销售金额。展示销售金额实际值与预测值。展示用户消费地点和消费时段。展示商品的存货周转天数。展示销售金额变化趋势。展示用户支付方式占比。展示用户类型人数占比。
2024-05-13 09:39:03 2238
原创 Echarts实训 咖啡店热门订单分析
(2) 绘制饼图与折线图联动图表。首先,在PieLineChartLinkage.html文件中引入echartsjs库文件。其次,准备一一个具备大小(weight与height)的div容器,并使用initn方法初始化容器。最后设置饼图与折线图的图表样式后,获取数据、填入数据并显示图表。基于“咖啡店年订单json”数据,绘制饼图与折线图的多图表联动,对咖啡店各年的订单数据进行分析。(1)在VS Code中创建PieLineChartL inkage.html文件。
2024-04-17 17:33:12 352 1
原创 Echarts之词云图
词云图是对文本中出现频率较高的“关键词”予以视觉化展现,词云图可以过滤掉大量低频低质的文本信息,使浏览者只要一 眼扫过文本就可领略大概主旨。词云图是一种非常好的图形展现方式,这种图形可以让人们分析同一篇文章中或者同一网页中关键词出现的频率。词云图对于产品排名、热点问题或舆情监测是十分有帮助的。利用function()创建随机样式函数,该函数通过随机函数产生红、绿、蓝(RGB)的三原色取值,从而合成一个随机的颜色,即可使得每个词云获得一个随机的颜色。
2024-04-08 08:47:05 377
原创 Spark练习
比如: Array(“hh”,“red”,“java”,“hadoop”)比如: Array(1,4,7,9,10,6,8,99,88,66)1、定义一个高阶函数,按照指定的规则对集合里面的每个元素进行操作。2、定义一个高阶函数,对数据中的元素按照指定的规则进行过滤。规则: 对集合中每个元素进行操作,得到集合每个元素的长度。比如:Array(10,4,6,10,2)3、对数据中的元素按照指定规则进行分组。4、根据指定规则对数组所有元素聚合。规则: 按照地址进行分组。规则: 只保留偶数数据。
2024-03-26 13:51:00 240
原创 下载安装IntelliJ IDEA 与安装Scala插件
2.6找到左下角Glob libararies,然后点击中间 + 号,选择最后一个 Scala SDK。2.3进入setting之后,找到plugins,搜索scala,点击instal进行下载即可。2.5重启之后,找到file(工具)——>project structure。3.1新建一个scala项目,file——>new——>project。2.7找到自己安装scala的版本(一定要选中),点击ok。3.2选择src——New——Scala Class。3.4选择Object名字(我选的test)
2024-03-14 19:56:24 1427 1
原创 Scala和Spark安装步骤
修改配置文件 在spark下的conf目录打开env vim spark-env.sh。source /etc/profile使环境变量生效,scala -version查看是否安装成功。配置环境变量 vim /etc/profile。jps查看有master就是对的。查看spark是否安装成功。
2024-03-13 09:55:19 462 1
原创 Echarts实战之折线图和条形图(代码)
步骤5:将配置项设置给echarts实例对象。三、条形图 (type:'bar')步骤1:引入echarts.js文件。步骤3:初始化echarts实例对象。一、Echarts初始化代码格式。(1)X轴为数值轴,Y轴为类目轴。(2)X轴为类目轴,Y轴为数值轴。步骤2:准备一个呈现图表的盒子。坐标轴类型的type标签。
2024-03-12 22:09:33 1216
原创 速速上车学Spark+Scala部署安装步骤
一、Spark是什么?sparkSpark是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台之一。Hadoop之父指出:大数据项目的MapReduce引擎的使用将下降,由取代。二、了解Spark的特点作为新一代轻量级大数据处理平台,SparkSpark是基于内存运行的而MapReduce是基于磁盘Spark的运行速度是运行速度的100多倍,Spark在磁盘上的运行速度是运行速度的10多倍。Spark支持使用ScalaPython。
2024-03-06 11:12:03 1678 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人