- 博客(1)
- 资源 (1)
- 收藏
- 关注
转载 pyspark链接mongodb数据操作
如何导入数据 数据可能有各种格式,虽然常见的是HDFS,但是因为在Python爬虫中数据库用的比较多的是MongoDB,所以这里会重点说说如何用spark导入MongoDB中的数据。 当然,首先你需要在自己电脑上安装spark环境,简单说下,在这里下载spark,同时需要配置好JAVA,Scala环境。 这里建议使用Jupyter notebook,会比较方便,在环境变量中这样设置 PY...
2018-12-25 13:14:28 4245 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人