DataFrame是spark1.3.0版本提出来的,spark1.6.0版本又引入了DateSet的,但是在spark2.0版本中,DataFrame和DataSet合并为DataSet。
DataFrame和DataSet是基于RDDs的,而且这三者之间可以通过简单的API调用进行无缝切换。
https://blog.csdn.net/weixin_39793644/article/details/79050762
DataFrame是spark1.3.0版本提出来的,spark1.6.0版本又引入了DateSet的,但是在spark2.0版本中,DataFrame和DataSet合并为DataSet。
DataFrame和DataSet是基于RDDs的,而且这三者之间可以通过简单的API调用进行无缝切换。
https://blog.csdn.net/weixin_39793644/article/details/79050762