- 博客(2)
- 收藏
- 关注
原创 偏相关分析
偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,判定指标是相关系数的R值。p值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关...
2018-05-15 09:42:28 2943
原创 pyspark.sql module的命令窗口学习,首先要将os,sc的导入,主要是join语法的学习,
import os os.environ['SPARK_HOME'] = "/opt/spark-2.0.1-bin-hadoop2.7"sc = SparkContext.getOrCreate()sqlContext = HiveContext(sc)l = [('Alice', 1),('jack',5),('kuna',10)]df12 = sqlContext.createDa...
2018-05-04 21:38:19 153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人