自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Basic Pyspark on how to use

创建;"local"是指让Spark程序本地运行,是指Spark程序的名称,这个名称可以任意(为了直观明了的查看,最好设置有意义的名称)。集合并行化创建RDD;collect算子:在驱动程序中将数据集的所有元素作为数组返回(注意数据集不能过大);停止。sc.stop()读取文件创建PySpark可以从Hadoop支持的任何存储源创建分布式数据集,包括本地文件系统,HDFSCassandraHBaseAmazon S3等。Spark支持文本文件,和任何其他。文本文件RDD可以使用创建的。

2024-02-08 11:21:20 994

原创 pyspark

all u need

2024-02-08 10:47:21 363

原创 使用LR构建评分卡模型

LR构建评分卡

2023-03-14 11:49:55 530

原创 作品集:基于 CNN 卷积神经网络的图像分析(运用python)

基于 CNN 卷积神经网络的图像分析(运用python)

2022-08-23 10:00:52 2656 1

原创 tableau学习案例

tableau学习项目

2022-08-23 09:18:06 1110 2

原创 基于python的马尔科夫链在股价预测中的应用(基于Tushare)

基于markov链(马尔科夫链)的股价应用,同时用Tushare搜集数据

2022-05-24 07:05:26 2754 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除