背景
Spark图计算实战:在pyspark环境下使用GraphFrames库
环境
- mac os
- conda→python=3.8
- jupyter notebook
- pyspark=3.3.0
- graphframes=0.6
代码
from pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSession
from graphframes import GraphFrame
sc = SparkContext()
spark = SparkSession(sc)
# Vertics DataFrame
vertics = spark.createDataFrame([
("a", "Alice", 34),
("b", "Bob", 36),
("c", "Charlie", 37),
("d", "David", 29),
("e", "Esther", 32),
("f", "Fanny", 38),
("g", "Gabby", 60)
], ["id", "name",

本文档详细记录了在mac os环境下,使用conda和jupyter notebook进行pyspark与GraphFrames集成时遇到的报错问题。通过查阅参考资料,找到了问题的根源在于缺失的jar包,并提供了下载和添加jar包的解决方案。最终,成功运行了graph初始化代码,同时分享了一些Spark Graph图计算的相关资源。
最低0.47元/天 解锁文章
1055

被折叠的 条评论
为什么被折叠?



