基于YELP数据集的商业数据分析

1.在安装环境是出现错误:安装完anaconda出现安装完但是还是显示不是系统内部命令

解决方法:

重新配置anaconda路径:使用命令vim ~/.bashrc配置环境为anaconda配置环境

 配置完成后使用source /etc/profile命令重载配置文件环境变量就配置好了

 当Jupyter nootbook实现PySpark交互时出现问题

解决方法:

多刷新两遍,问题就莫名其妙好了 (Spark运行需要等会儿,连点两下交互会重复打开Spark,会造成这个报错,所以耐心一点不会出错)

代码错误部分:

1.进行数据清洗的时候出现Java.io报错

解决方法:虚拟机磁盘空间不够进行扩容

2.在进行清洗后的数据进行分析时会出现报错:pyspark : NameError: name 'spark' is not defined

原因:from pyspark.sql import SparkSession:我们导入的时候没有初始化,没有创捷spark对话

解决方法:在代码中加入spark = SparkSession.builder.appName('abc').getOrCreate()创建spark就能解决spark not defined

3.数据可视化jupyter notebook不显示图片<Figure size 640x480 with 1 Axes>问题

解决方法:在代码头部添加%matplotlib inline即可

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值