机器学习 scikit-learn(1)

原创 2016年08月31日 14:53:16

1. 通过样本来预测未知的数据;通过学习数据集的特征(训练集 training set)来应用到新的数据上。

2. 监督学习:

分类:样本属于多于两个类,我们想要从已经标记过的数据来预测未标记数据的类---digits

回归:如果想要的输出包括多余一个连续的变量
    无监督:

训练集包括一系列的矢量X而没有相对应的y(目标值)。

3. 学习和预测

在数字集中,任务是预测给出图片。

分类的估计量------fit(X,y) & predict(T)

估计量的一个例子是一个类sklearn-svm-SVC

>>> from sklearn import svm
>>> clf = svm.SVC(gamma=0.001, C=100.)

我们把估计量例子clf当作分类器。它必须适应模型,换句话说就是学习模型。所以我们要传递数据集去给是适应模型。作为训练集,我们使用除了最后一个所有数据集的图片。

>>> clf.fit(digits.data[:-1], digits.target[:-1])  
SVC(C=100.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape=None, degree=3, gamma=0.001, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)

之后我们可以询问数据集最后一个是什么

>>> clf.predict(digits.data[-1:])
array([8])

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

尝试向分析类转型1--scikit-learn(机器学习) 和 Weka(数据挖掘)

前段时间的那个微博爬虫一直爬着。。 现在库里有20w id 和 10 w 转发微博  10w 原创微博 这个项目算是失败了,因为效率太低了,微博更新那么快,爬虫速度又那么慢。。。 所以根本来不及拿...

Python与机器学习1——scikit-learn使用的简易框架

Python与机器学习1——scikit-learn使用框架 本系列博客主要参考《利用Python进行数据分析》、《Python数据挖掘入门与实践》、《机器学习》(周志华)。以后两本为主线学习。 第...

机器学习(1)scikit-learn的介绍

章节内容 在本节中,我们介绍我们在scikit-learn中使用的机器学习词汇,并给出一个简单的学习示例。 机器学习:问题设置 一般来说,学习问题考虑一组n个数据样本,然后尝试预测未知数据的属性。 ...

Python机器学习库scikit-learn实践

http://blog.csdn.net/zouxy09/article/details/48903179 一、概述        机器学习算法在近几年大数据点燃的热火熏陶下已经变得被人所“熟知”,就...

Python3.2 安装scikit-learn机器学习包

  • 2013年04月17日 16:30
  • 44.84MB
  • 下载

[机器学习实战]使用 scikit-learn 预测用户流失

客户流失“流失率”是描述客户离开或停止支付产品或服务费率的业务术语。这在许多企业中是一个关键的数字,因为通常情况下,获取新客户的成本比保留现有成本(在某些情况下,贵5到20倍)。因此,了解保持客户参与...

机器学习scikit-learn入门教程

原文链接:http://scikit-learn.github.io/dev/tutorial/basic/tutorial.html 章节内容 在这个章节中,我们主要介绍关于scikit...

python/scikit-learn机器学习库(回归分析)

广义的线性回归模型为: scikit-learn库中将结果存放为coef_,将结果存放为intercept_。回归模型最小二乘法回归最小二乘法计算目标就是: from sklearn imp...
  • ae5555
  • ae5555
  • 2015年10月31日 16:03
  • 968
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:机器学习 scikit-learn(1)
举报原因:
原因补充:

(最多只允许输入30个字)