本篇实现了spark上softmax算法,算法原理参考:http://deeplearning.stanford.edu/wiki/index.php/Softmax_Regression
训练样本采用稀疏形势表达,因此实现了2个类SparserVector和DenseMatrix分别表示稀疏向量和密集矩阵。
完整代码没有贴出,可以在这里下载http://download.csdn.net/detail/liangliang8086/6731397
主要代码:
package spark.ml.classification
import java.util.Random
import scala.collection.mutable.HashMap
import scala.io.Source
import org.apache.spark.SparkContext
import org.apache.spark.rdd.RDD;
import org.apache.spark.util.Vector
import java.lang.Math
import org.apache.spark.broadcast.Broadcast
import spark.ml.utils.SparserVector
import spark.ml.utils.DenseMatrix
object SparseSoftma