机器学习算法
文章平均质量分 73
wyn1175397098zt
我的生活我做主;
没有做不到只有想不到;
展开
-
模型评估标准-AUC
图中表格里面的数据的看法是:P和N分别加上单元格内的T(true)或者F(false)举例: 假设我们有60个正样本,40个负样本,我们要找出所有的正样本。系统预测出50个,其中只有40个是真正的正样本,计算上述各指标: TP:将正类预测为正类数 40 ...原创 2018-04-08 11:44:32 · 484 阅读 · 0 评论 -
逻辑回归算法的优化
一:有无截距: 如上图。可以知道,有截距的线条数比无截距的线条数(过原点的线条)要多。所以在选择逻辑回归的时候,通常要设置截距。增加正确的概率。 代码: val lr = new LogisticRegressionWithSGD() ----创建逻辑回归对象 lr.setIntercept(true) -...原创 2018-04-14 18:00:26 · 3881 阅读 · 0 评论 -
scala的简单语法
数据类型 : byte 8bit的有符号数字,范围在 -128 --127 short 16bit 有符号数字,范围在-32768 --32767 int 32 bit 有符号数字 long 64bit 有符号数字 float 32bit单精度浮点数 double 64 bit 双精度浮点数 char 16bit 字符 String 字符串 ...原创 2018-04-14 19:08:15 · 159 阅读 · 0 评论 -
逻辑回归算法的理解
逻辑回归算法又称logistic回归,是一种广义的线性回归模型,逻辑回归是一种用于分类的算法。 最常见的问题如医生看病时。需要望,闻,问,切之后判断病人是否生病或者生了什么病。其中望,闻,问,切就是输入即特征数据,而是否生病就相当于获取因变量y,也就是分类的结果。 逻辑回归的公式: z=w0+w1x1+w2x2+w3x3+w...原创 2018-04-04 10:27:18 · 497 阅读 · 0 评论 -
逻辑回归简单的代码(scala实现)
package com.sxt.scala.lrimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.mllib.regression.LabeledPointimport org.apache.spark.mllib.linalg.Vectorsimport org...原创 2018-04-04 10:34:14 · 1128 阅读 · 0 评论 -
Kmeans聚类算法
Kmeans聚类算法:K均值聚类 聚类:给事物打标签,寻找同一个组内的个体之间的一些潜在的相似模式。力图找到数据的自然分组Kmeans。 聚类是一种无监督的机器学习任务,他可以自动将数据划分成类cluster。因此聚类分组不需要提前被告知所划分的组应该是什么样的。因为我们甚至可能都不知道我们寻找什么。所以聚类是用于只是发现而不是预测。列入下图。 ...原创 2018-04-04 11:02:35 · 785 阅读 · 0 评论