- 博客(2)
- 收藏
- 关注
原创 spark常见报错汇总
持续更新ing… Heap oom Spark程序本质上是一个分布式的jvm应用, 因此当内存设置不合理,内存有泄露,使用不当或者内存管理不够好的时候容易出现java heap oom Driver heap oom 在Driver的日志中发现有OutOfMemoryError相关的日志,说明是driver oom导致作业失败,常见错误有 java.lang.OutOfMemoryError: Java heap space at java.lang.OutOfMemoryError: GC overhe
2020-12-24 10:12:02
15
原创 DataFrame基本结构化操作
DataFrame是Row类型的Dataset集合。 spark.range(2).toDF().collect() spark类型:可以通过如下使用Scala类型 import org.apache.spark.sql._ val b = ByteType DataFrame创建示例: val df = spark.read.format("json") .loan("/data/t.json") 创建的df可以通过如下方式查看模式: df.printSchema() df.schema 列: 有
2020-12-09 22:34:28
38
空空如也
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝