统计分析学习
axiaye
这个作者很懒,什么都没留下…
展开
-
pyspark 交叉验证的实现
pyspark 中的交叉验证在pyspark中调用交叉验证的方式来建模。from pyspark.ml.classification import LogisticRegressionfrom pyspark.ml.evaluation import BinaryClassificationEvaluatorfrom pyspark.ml.tuning import CrossValidatorfrom pysparl.ml.feature import VectorAssemblerfrom原创 2021-03-11 14:57:08 · 971 阅读 · 0 评论 -
pyspark 中算法和模型的运用
pyspark 中算法和模型的运用LogisticRegression和LogisticRegressionModel的区别LogisticRegression和LogisticRegressionModel的区别LogisticRegression用于引入平台的逻辑回归模型,在建模时需要设置对应的参数值,在模型训练好后,可以利用save(modelPath) 对训练好的模型进行保存,tips(在保存模型时,需要确保保存的路径下没有改名称的文件,如果之前就有导出,则需要删除或者用overwrite()函原创 2021-02-26 16:49:51 · 752 阅读 · 0 评论 -
单因素Anova分析 Python实现
单因素方差分析常用于判断在多个分组中某个指标是否具有显著差异,下面以射击比赛为例,三位选手分别成绩如下:Pat - 5, 4, 4, 3, 9, 4Jack - 4, 8, 7, 5, 1, 5Alex - 9, 9, 8, 10, 4, 10基于上述数据,我们希望判断上述三个选手中成绩最好的。原假设:三个选手的成绩无显著差异。拒绝原假设的就表示在三个选手中至少有两个人是具有显著差异的...原创 2019-07-19 10:44:51 · 10020 阅读 · 0 评论