使用Python完成你的第一个学习项目

你是否想使用python进行机器学习但却难以入门? 在这篇教程中,你将用Python完成你的第一个机器学习项目。 在以下的教程中,你将学到:

下载并安装Python SciPy,为Python中的机器学习安装最有用的软件包。
使用统计摘要和数据可视化加载数据集并了解其结构。
创建6个机器学习模型,并挑选出最佳模型以确保准确性。
本教程为决心使用python进行机器学习的新手做一个讲解。 让我们开始吧!

2017/01 更新:更新后反映了版本0.18中的scikit- learn API的变化。
2017/03 更新:添加了有助于设置Python环境的链接。
如何开始在Python中的机器学习?
学习机器学习的最好方式是设计和完成小型项目。
在入门时Python遇到的困难
Python是一种当下流行并且功能强大的解释型语言。与R语言不同,Python有完善的语言和平台,能用来研究和开发。 还有很多模块和库可以选择,提供多种方式来完成每个任务。 开始使用Python进行机器学习的最好方法是完成一个项目。
它将促使你安装并启动Python解释器。
它让你全面的观察怎样通过一个小项目。
它会给你信心,也许会驱动你继续做自己的小项目。
初学者需要一个小型的端到端项目
很多书籍和课程让人失望。他们给你很多方法和片段,但你永远不会看到他们如何融合在一起。 当你将机器学习应用在自己的数据集时,你已经开始了一个项目。 机器学习项目可能不是线性的,但它有许多典型的步骤:
定义问题
准备数据
评估算法。
改善成绩。
得到结果。
真正开始新平台或工具的最佳方式是通过一个机器学习项目进行端到端,并覆盖关键步骤。也就是从加载数据、总结数据、评估算法和做出一些预测。 如果可以这样做,您将有一个可以在数据集之后的数据集上使用的模板。一旦你有更多的信心,你可以进一步的填补数据和改进结果的差距。
机器学习的Hello World
开始使用新工具的最好的小项目是鸢尾花的分类(如鸢尾花数据集)。 这是一个很好理解的项目。
属性是数值型的,因此你必须弄清楚如何加载和处理数据。
这是一个分类问题,允许你练习更简单的监督学习算法。
这是一个多类的分类问题(多项式),可能需要一些专门的处理。
它只有4种属性和150行,这意味着它很小,很容易与内存(以及屏幕或A4页面)相匹配。
所有的数值属性都是相同的单位和相同的比例,不需要任何特殊的缩放或变换来开始。
让我们开始使用Python中的hello world机器学习项目。
Python中的机器学习:分步教程
在本节中,我们将通过端到端的小型机器学习项目进行工作。 以下是我们将要介绍的内容:
安装Python和SciPy平台
加载数据集
汇总数据集
可视化数据集
评估一些算法
做一些预测
慢慢来,一步一步做。 你可以尝试自己输入命令也可以通过复制粘贴来加快速度。
1.下载,安装和启动Python SciPy
如果你的系统上没安装Python和SciPy平台那就要安装。 我不想太详细地介绍这个,因为有别人已经有介绍过了,这对一个开发人员来说很简单。
1.1安装SciPy库
本教程假定Python版本为2.7或3.5。 你需要安装5个关键库。以下是本教程所需的Python SciPy库列表:
SciPy
numpy
matplotlib
pandas
sklearn
有很多方法来安装这些库。 该SciPy的安装页面对多个不同的平台提供了极好的说明书,如Linux,Mac OS X和Windows。如果你有任何疑问或疑问,请参阅本说明。
在Mac OS X上,你可以使用macports来安装Python 2.7和这些库。有关macports的更多信息,请参阅主页。
在Linux上,你可以使用包管理器,例如Fedora上的yum来安装RPM。
如果你使用Windows或者你没什么信心,我建议安装免费版本的Anaconda,其中包含你需要的一切。 注意:本教程假设你已经安装scikit-learn版本0.18或更高版本。 需要更多帮助?请参阅以下教程之一:
如何为Anaconda设置机器学习和深度学习的Python环境
如何使用Python创建用于机器学习开发的Linux虚拟机
1.2启动Python并检查版本
确保你的Python环境安装成功并按预期工作。 下面的脚本将帮助你测试你的环境。它导入本教程中所需的每个库并打印出版本。 打开命令行并启动python解释器:
python
我建议直接在解释器中工作,或者编写脚本,并在命令行上运行它们,而不是用大型编辑器和IDE。不要让事情变复杂,专注于机器学习而不是工具链。 键入或者粘贴以下脚本:

# Check the versions of libraries

# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'<
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值