厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）

最新推荐文章于 2023-05-19 08:49:52 发布

吃西红柿的鸡蛋

最新推荐文章于 2023-05-19 08:49:52 发布

阅读量1.4k

点赞数 1

分类专栏：大数据文章标签： hadoop spark python

本文链接：https://blog.csdn.net/Timemachine0628/article/details/107074910

版权

厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）

项目地址http://dblab.xmu.edu.cn/blog/2307/

踩坑:

Spark分析文件rent_analyse.py

改变Spark读取csv文件的写法

    sparkContext = SparkContext("local","rent_analyse")
    sqlContext = SQLContext(sparkContext)
    df = sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load(filename)

原写法会报连接错误，同时在读取csv文件时需要添加format参数，否则又会报错
在读取csv文件时文件路径需要加上file:///，如：
```
"file:///develop/sparkSpace/rent.csv"
```
如果文件参数默认为文件名，则Spark会到Hadoop的文件系统里读取数据，路径为：
```
"hdfs://localhost:9000/user
```

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

吃西红柿的鸡蛋

关注关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）

厦门租房信息分析展示（pycharm+python爬虫+pyspark+pyecharts）（踩坑记录）项目地址http://dblab.xmu.edu.cn/blog/2307/踩坑:Spark分析文件rent_analyse.py改变Spark读取csv文件的写法 sparkContext = SparkContext("local","rent_analyse") sqlContext = SQLContext(sparkContext) df = sqlCon
复制链接

扫一扫