Spark
文章平均质量分 51
Spark 基础及高阶知识汇总
Harrytsz
这个作者很懒,什么都没留下…
展开
-
腾讯云服务器下利用 Docker 极速搭建 Spark 集群和 HDFS 集群
搭建 Spark 和 hdfs 的集群环境会消耗一些时间和精力,处于学习和开发阶段的同学关注的是 Spark应用的开发,他们希望整个环境能快速搭建好,从而尽快投入编码和调试,今天咱们就借助 Docker 容器,极速搭建和体验 Spark 和hdfs 的集群环境.实战环境信息以下是本次实战涉及的版本号:操作系统:腾讯云 Ubuntu 服务器hadoop:2.8Spark:2.3docker:17.03.2-cedocker-compose:1.23.2极速搭建 Spark 集群和 hdfs原创 2022-03-25 14:12:30 · 3253 阅读 · 0 评论 -
Scala 连接 MySQL -- JDBCUtil.scala
import java.sql.{Connection, PreparedStatement}import java.util.Propertiesimport com.alibaba.druid.pool.DruidDataSourceFactoryimport javax.sql.DataSourceobject JDBCUtil { // 初始化连接池 var dataSource: DataSource = init() def init(): DataSource = {原创 2021-12-04 21:28:54 · 1022 阅读 · 0 评论 -
PySpark 列的合并与拆分
1、读入数据>>> from pyspark.sql import SparkSession>>> spark = SparkSession.builder.master("local").appName("dataframe_split").config("spark.some.config.option", "some-value").getOrCreate()>>> sc = spark.sparkContext>>> d原创 2021-11-23 22:53:17 · 2514 阅读 · 1 评论