spark读取csv文件

最新推荐文章于 2023-06-13 21:03:46 发布

月落乌啼silence

最新推荐文章于 2023-06-13 21:03:46 发布

阅读量5.9k

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18293213/article/details/52781615

版权

spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

spark读取csv文件，如果用textFile直接读取也可以，但是对于后续的操作不太方便。所以要采用sqlContext来读取csv文件

在shell中直接使用sqlContext 时会报错，所以启动时要添加依赖包

./spark-shell --packages com.databricks:spark-csv_2.10:1.3.0

这样就直接进入了shell，然后加载hdfs上的csv文件，

val df = sqlContext.load("com.databricks.spark.csv", Map("path" -> "sfpd.csv", "header" -> "true"))

header默认为false，表示显示表格的第一行，也就是表头，如果为true的话就是不显示

月落乌啼silence

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

月落乌啼silence CSDN认证博客专家 CSDN认证企业博客

码龄10年

107: 原创

3万+: 周排名

212万+: 总排名

69万+: 访问

: 等级

4665: 积分

160: 粉丝

185: 获赞

117: 评论

869: 收藏

私信

关注

热门文章

分类专栏

Golang 1篇
深度学习 4篇
机器学习 5篇
推荐算法 6篇
Hadoop 1篇
spark 6篇
Linux 15篇
机器学习 11篇
Scala 2篇
maven 1篇
Java 6篇
总结与规划 4篇
深度学习 20篇
python 6篇
小常识 9篇
论文研读与实验记录 5篇
Leetcode 29篇
c++ 3篇

最新评论

XGBoost算法介绍
千万别报错: 很棒！作为刚学的小白，十分感谢！
推荐算法-PNN(Product Network)
沉浸致远: 请问，IPNN中p部分，我看论文公式中用的就是对称矩阵P参与计算的啊，只是为了降低复杂度才进行了矩阵分解，为什么代码直接除与2了呢
在服务器上配置jupyter, 远程登录
Gygert: 为哈我登录不上？好像是密码错误？改了几次密码了
画pytorch模型图，以及参数计算
weixin_48253350: 虽然能运行，但是不太友好，很多诸如CopyBackwards、UnsqueezeBackward0、SliceBackward，说实话我不太知道具体啥意思，而且模型一复杂，这个图会非常长，模型图果然都是自己做出来的，大家还是自己现理解结构然后自己绘制比较好，感谢博主分享了
推荐算法－AFM
winner8881: p:[attentionSize,1]，这个也不对呢，应该是p:[embeddingSize,1]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。