【每周Java技术】2022.10.17 周一到 10.23 周日

最新推荐文章于 2024-07-29 14:22:26 发布

打破砂锅问到底007

最新推荐文章于 2024-07-29 14:22:26 发布

阅读量112

点赞数

文章标签： java scala spark

本文链接：https://blog.csdn.net/xinkuaile/article/details/127375715

版权

文章目录

一、10.17 周一
- 1.1）TiDB
- 1.2）Spark2.1.0入门：DataFrame的创建
二、10.18 周二
- 2.1）Spark教程

一、10.17 周一

1.1）TiDB

TiDB 高并发写入场景最佳实践
就是将 ID散列

1.2）Spark2.1.0入门：DataFrame的创建

文档链接

scala> import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.SparkSession
 
scala> val spark=SparkSession.builder().getOrCreate()
spark: org.apache.spark.sql.SparkSession = org.apache.spark.sql.SparkSession@2bdab835
 
//使支持RDDs转换为DataFrames及后续sql操作
scala> import spark.implicits._
import spark.implicits._
 
scala> val df = spark.read.json("file:///usr/local/spark/examples/src/main/resources/people.json")
df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]
 
scala> df.show()
+----+-------+
| age|   name|
+----+-------+
|null|Michael|
|  30|   Andy|
|  19| Justin|
+----+-------+

mac 安装 spark
brew install hadoop
brew install spark

可用：Spark简要教程系列（一） Mac安装Spark

cd spark/spark-3.3.0-bin-hadoop3/bin
./spark-shell

这样就启动起来了 scala

在这里插入图片描述

scala> df.select(df("name"), df("age") + 1).show()
+-------+---------+
|   name|(age + 1)|
+-------+---------+
|Michael|     null|
|   Andy|       31|
| Justin|       20|
+-------+---------+


scala> df.filter(df("age") > 20).show()
+---+----+
|age|name|
+---+----+
| 30|Andy|
+---+----+