- 博客(7)
- 收藏
- 关注
原创 Hive 常见问题点记录
缺少MySQL驱动包1.1 问题描述Caused by: org.datanucleus.store.rdbms.connectionpool.DatastoreDriverNotFoundException: The specified datastore driver (“com.mysql.jdbc.Driver”) was not found in the CLASSPATH. Pl...
2020-01-20 14:58:15 1332
原创 pandas-profiling
对于探索性数据分析来说,做数据分析前需要先看一下数据的总体概况,pandas_profiling工具可以快速预览数据。1、pandas-profiling安装与调用pip install pandas-profilingimport pandas as pdimport pandas_profiling2、导入数据data=pd.read_csv(“model.csv”)3、直接查看...
2019-10-09 13:56:36 552
原创 Win上安装运行Spark
一、JDK的安装1、1 下载JDK 首先需要安装JDK,并且将环境变量配置好,如果已经安装了的老司机可以忽略。JDK(全称是JavaTM Platform Standard Edition Development Kit)的安装,去Oracle官网下载,下载地址是Java SE Downloads 。上图中两个用红色标记的地方都是可以点击的,点击进去之后可以看到这个最新版本的一些更为详细的...
2019-08-31 20:53:31 238
原创 Win上安装运行Hadoop
1.下载JDK,并设置JAVA_HOME。(使用不带空格的路径,比如Program Files,将在后面的配置中报错!)假设JAVA_HOME路径为C:\Java\jdk1.8.0_732.下载hadoop。下载地址:http://hadoop.apache.org/releases.html如果在当前页中没找到2.8.3版本,可以到所有版本的下载列表中去找:https://archive....
2019-08-31 20:48:05 263
原创 PIP的一些操作
pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/pip install x -i url
2019-08-31 20:44:28 119
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人