scala优势在于工程上线,效率高、稳定。
python(pyspark)优势在于快速分析、搭建原型。
在做一些简要任务时没有形成最终的工程任务,仅在于pyspark分析,但是有些功能只能scala的API才提供支持。
所以这时候需要scala与python可以进行变量共享(全局变量)
此也主要记录别人的例子,因为相关资料少,搜索也费了一点功夫,便于后续快速查找使用。
apache-zeppelin – Zeppelin – 将变量从Spark传递到Markdown以生成动态叙述文本
https://codeday.me/bug/20190611/1218230.html
将Spark DataFrame从Python移动到Scala,而不是Zeppelin
https://codeday.me/bug/20190512/1081678.html
Zeppelin: Scala Dataframe to python
https://stackoverflow.com/questions/35719142/zeppelin-scala-dataframe-to-python
Apache – Zeppelin跨段使用变量
https://codeday.me/bug/20190129/597676.html
How to put a variable into z ZeppelinContext in javascript in Zeppelin?
https://stackoverflow.com/questions/38335170/how-to-put-a-variable-into-z-zeppelincontext-in-javascript-in-zeppelin/38353337#38353337