参考博客: sparkmlib使用Pipeline实现简单的逻辑回归 Pipeline详解及Spark MLlib使用 Spark MLlib实现的中文文本分类–Naive Bayes Spark MLlib源码分析—TFIDF源码详解