机器学习
文章平均质量分 56
BabyBirdToFly
编程成就美好人生!!!!!!
展开
-
python-sklearn学习笔记(1)svm
scikit-learn的安装:'''python#安装gcc库brew install gcc#安装scipypip install scipy后面的安装,就按步就班了#安装matplotlib,方便把数据绘图显示出来pip install matplotlib#安装sklearn,我理解这个安装必须在pandas之前pip install -U numpy scipy scikit-原创 2017-06-05 17:09:21 · 992 阅读 · 0 评论 -
sklearn学习笔记(2)交叉验证
link text 几种不同的CV策略生成器 cross_val_score中的参数cv可以接受不同的CV策略生成器作为参数,以此使用不同的CV算法。除了刚刚提到的KFold以及StratifiedKFold这两种对rawdata进行划分的方法之外,还有其他很多种划分方法,这里介绍几种sklearn中的CV策略生成器函数。 K-fold 最基础的CV算法,也是默认采用的CV策略。主要的参数原创 2017-06-06 17:42:40 · 3743 阅读 · 0 评论 -
sklearn学习笔记(3)svm多分类
SVC、NuSVC、LinearSVC都可以在一个数据集上实现多分类。 SVC和NuSVC方法类似,但是有不同的输入参数集和不同的数学表述。另一方面,linearSVC是SVC的在线性核的基础上的另一种实现,所以LinearSVC不能不能接受关键字“kernel”,只能是线性。 二分类 和别的分类器一样,三种分类器需要输入两个数组:X[n样本][n维特征](训练数据集)Y[n个标签](类标签)翻译 2017-06-06 19:55:45 · 36809 阅读 · 0 评论 -
分类器性能指标之ROC曲线、AUC值
一 roc曲线1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity)纵轴:真正类率(true postive rate TPR)灵敏度,Sensitivity(正类覆盖率)转载 2017-06-24 11:37:28 · 555 阅读 · 0 评论