Scikit-learn学习笔记(一)

Scikit-learn学习笔记(一)

    这段时间在学习机器学习相关的知识,一方面要学习理论知识,另一方面还要不断的练习和实践,只有不断的实践才能真正地掌握和理解这些理论知识。在众多编程语言中,python具有独特的优势,也是机器学习领域使用最多的语言之一,因为其语法简洁、可移植性好以及快速迭代的优势,使其成为机器学习各种算法实现的最佳载体之一,scikit-learn是python版的机器学习库,其内部实现了众多常用的机器学习算法,受到许多机器学习爱好者的青睐。

1. scikit-learn简介

    自2007年发布以来,scikit-learn已经成为最给力的Python机器学习库(library)了。scikit-learn支持的机器学习算法包括分类,回归,降维和聚类。还有一些特征提取(extracting features)、数据处理(processing data)和模型评估(evaluating models)的模块。作为Scipy库的扩展,scikit-learn也是建立在Python的NumPy和matplotlib库基础之上。NumPy可以让Python支持大量多维矩阵数据的高效操作,matplotlib提供了可视化工具,SciPy带有许多科学计算的模型。
    scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎。开发者用scikit-learn实验不同的算法,只要几行代码就可以搞定。scikit-learn包括许多知名的机器学习算法的实现,包括LIBSVM和LIBLINEAR。还封装了其他的Python库,如自然语言处理的NLTK库。另外,scikit-learn内置了大量数据集,允许开发者集中于算法设计,节省获取和整理数据集的时间。
    scikit-learn可以不受任何限制,遵从自由的BSD授权。许多scikit-learn的算法都可以快速执行而且可扩展,除了海量数据集以外。最后,scikit-learn稳定性很好,大部分代码都可以通过Python的自动化测试(mock,nose等)。

2. 安装scikit-learn

    目前scikit-learn的稳定版本是0.17.1。用这个版本可以保证本书的代码可以正常运行,如果你之前装过,可以检查一下版本:

In [3]:
import sklearn
sklearn.__version__
Out[3]:
'0.17.1'

    如果你还没安装,你可以通过pip安装,也可以从源代码安装。下面我们简单介绍一下Windows,Linux和Mac OS系统分别安装的过程,具体内容可以从官方网站 (http://scikitlearn.org/dev/install.html)找到。Python版本需要是Python (>= 2.6 or >= 3.3),NumPy (>= 1.6.1),SciPy (>= 0.9)。

2.1 Windows系统安装

    强烈建议使用miniconda (http://conda.pydata.org/miniconda.html)安装,可以根据Windows系统版
本和想要的Python版本选择下载安装。
miniconda会自动安装scikit-learn的依赖包,如NumPy和SciPy等。双击安装文件安装miniconda,之后在命令行工具输入下列指令:

conda install scikit-learn

确实之后一会儿就安装完了,如果要更新版本,直接输入:

conda update scikit-learn

如果已经装好了Python,Numpy和Scipy,可以用pip安装(Python 2.7.9和Python3.4自带):

pip install -U scikit-learn
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值