机器学习
lichao_ustc
这个作者很懒,什么都没留下…
展开
-
机器学习 scikit-learn安装
scikit-learn安装1.Linux平台安装现需要安装在Linux平台安装python 和 pip。然后通过pip安装scikit-learn库pip install numpypip install matplotlib pip install pandaspip install scipy //ubuntu上需要先sudo apt-get install libblas-dev l原创 2016-08-24 09:27:48 · 629 阅读 · 0 评论 -
Spark ML函数VectorAssembler
从源数据中提取特征指标数据,这是一个比较典型且通用的步骤,因为我们的原始数据集里,经常会包含一些非指标数据,如 ID,Description 等。为方便后续模型进行特征输入,需要部分列的数据转换为特征向量,并统一命名,VectorAssembler类完成这一任务。VectorAssembler是一个transformer,将多列数据转化为单列的向量列。import org.apache.spark.原创 2016-09-28 10:09:39 · 16484 阅读 · 0 评论 -
混淆矩阵ConfusionMatrix
Confusion Matrix在机器学习领域,混淆矩阵(confusion matrix),又称为可能性表格或是错误矩阵。它是一种特定的矩阵用来呈现算法性能的可视化效果,通常是监督学习(非监督学习,通常用匹配矩阵:matching matrix)。其每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个clas转载 2016-09-29 16:34:29 · 7853 阅读 · 0 评论