- 博客(6)
- 收藏
- 关注
原创 Basic Pyspark on how to use
创建;"local"是指让Spark程序本地运行,是指Spark程序的名称,这个名称可以任意(为了直观明了的查看,最好设置有意义的名称)。集合并行化创建RDD;collect算子:在驱动程序中将数据集的所有元素作为数组返回(注意数据集不能过大);停止。sc.stop()读取文件创建PySpark可以从Hadoop支持的任何存储源创建分布式数据集,包括本地文件系统,HDFSCassandraHBaseAmazon S3等。Spark支持文本文件,和任何其他。文本文件RDD可以使用创建的。
2024-02-08 11:21:20 994
原创 基于python的马尔科夫链在股价预测中的应用(基于Tushare)
基于markov链(马尔科夫链)的股价应用,同时用Tushare搜集数据
2022-05-24 07:05:26 2754 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人