自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

legotime的博客

个人博客：www.ryanbing.com

legotime CSDN认证博客专家 CSDN认证企业博客

码龄9年

70: 原创

17万+: 周排名

69万+: 总排名

44万+: 访问

: 等级

3839: 积分

95: 粉丝

243: 获赞

39: 评论

230: 收藏

私信

关注

热门文章

分类专栏

最新评论

Spark从外部读取数据之textFile
kikilada: 嗯？看这个回答感觉源数据大小为300M，textFile读出来之后数据大小也为300M，但层主是问textFile读出来的数据大于300M了
Spark从外部读取数据之textFile
加工费学技术: spark可以读取其他节点的数据吗？这个格式要怎么写，楼主有考虑过吗？
Spark从外部读取数据之textFile
我的猪仔队友: spark能否读取远程linux机器上存储的文件？？
Spark从外部读取数据之textFile
doufanfan 回复高亮: 你好，我在看别人的博文https://www.jianshu.com/p/4b7d07e754fa里面是说：spark读取本地和hdfs所生成的dataframe或者rdd的分区数=max（本地file的分片数/hdfs的block的数量，sc.defaultMinPartitions）。这个结论和你的回答主要就还是在“疑问2，若文件大小为180MB，minPartitions设置为3时，将分成几个partition呢？”上面有分歧，请问哪种是对的？
spark源码阅读笔记Dataset（三）structField、structType、schame
BraveAsta: 感谢分享

最新文章

SparkML

关注

文章平均质量分 88

关注数：文章数：21 文章阅读量：130801 文章收藏量：94

作者: legotime

这个作者很懒，什么都没留下…

展开