机器学习应用——导学part

Python之机器学习第一弹。
Python被称为最简单好上手的语言之一,基于其极强的关联性,对各种库的引用,和资源的关联,使其实现功能非常容易。一些底层逻辑不需过多过深的理解。

机器学习是Python发展中应用广泛的一个领域。
本篇将简要介绍:
1.机器学习概念
2.sklearn库初步介绍(标准数据集及基本功能)
3.一些相关书籍及课程推荐

一、机器学习的目标

1.机器学习简介及其分类

(1)机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。
(2)特点
①多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科
②广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用

(3)分类
①监督学习(Supervised Learning)
②无监督学习(Unsupervised Learning)
③强化学习(Reinforcement Learning,增强学习)
④半监督学习(Semi-supervised Learning )
⑤深度学习(Deep Learning)

2.Python Scikit-learn(一组简单有效的机器学习工具集)

①依赖Python的NumPy,SciPy和matplotlib库
②开源、可复用
③常用函数
在这里插入图片描述

3.相关书籍及课程推荐

①图书-《机器学习》-周志华(西瓜书)
出版社:清华大学出版社
主页:http://t.cn/RXvpCKB

②图书-《PRML》- Bishop
出版社:Springer
主页:http://t.cn/RXv0YVz
此书为机器学习贝叶斯学派的经典书籍,广度深度,可读性及可用性兼顾

③课程-《Machine Learning 》 - Andrew Ng
Coursera版:前百度首席科学家斯坦福教授吴恩达老师(Coursera创始人)录制的在线课程
课程主页:http://t.cn/RJZQbV2 Stanford手书版
在线观看:http://t.cn/RwUWKMS
课程主页:http://cs229.stanford.edu/
此课程讲解机器学习的原理和算法知识

④课程-《CS231n》 - Fei-Fei Li(斯坦福大学)
课程主页:http://cs231n.stanford.edu/
在线观看:http://t.cn/RqRNasR
主要介绍深度学习在计算机视觉领域的应用

⑤课程-《Reinforcement Learning》- David Silver
课程主页;http://t.cn/Rw0rwtU
在线观看:http://t.cn/RIAfRUt
由AlphaGo的主要开发者团队讲解的,有关强化学习和深度强化学习原理及其应用技术

二、Sklearn库的安装

1.sklearn库

①sklearn是scikit-learn的简称,是一个基于Python的第三方模块。
②sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用sklearn库中提供的模块就能完成大多数的机器学习任务。

③sklearn库是在Numpy、Scipy和matplotlib的基础上开发而成的,因此在介绍sklearn的安装前,需要先安装这些依赖库。

2.sklearn库的基础库

①Numpy (Numerical Python的缩写)是一个开源的Python科学计算库。
②Scipy库是sklearn库的基础,它是基于Numpy的一个集成了多种数学算法和函数的Python模块。
③matplotlib是基于Numpy的一套Python工具包,它提供了大量的数据绘图工具。

3.安装顺序

在这里插入图片描述

三、sklearn库中的标准数据集及基本功能

1.数据集总览

在这里插入图片描述

注:小数据集可以直接使用,大数据集要在调用时程序自动下载(一次即可)
这里举几个例子

2.波士顿房价数据集

①波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋周围的详细信息。
②其中包括城镇犯罪率、一氧化氮浓度、住宅平均房间数、到中心区域的加权距离以及自住房平均房价等。
③因此,波士顿房价数据集能够应用到回归问题上。
④部分数据
在这里插入图片描述

⑤使用sklearn.datasets.load boston即可加载相关数据集
⑥重要参数:
return_X_y:表示是否返回target(即价格),默认为False,只返回data(即属性)。

3.鸢尾花数据集

①鸢尾花数据集采集的是鸢尾花的测量数据以及其所属的类别。
②测量数据包括:尊片长度、尊片宽度、花瓣长度、花瓣宽度。
③类别共分为三类:Iris Setosa,Iris Versicolour,Iris Virginica。可用于多分类问题。
④使用sklearn.datasets.load iris即可加载相关数据集

⑤参数:
return_X_y:若为True,则以(data,target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。

4.手写数字数据集

①手写数字数据集包括1797个0-9的手写数字数据,每个数字由8*8大小的矩阵构成,矩阵中值的范围是0-16,代表颜色的深度。
②数字0的样本
在这里插入图片描述
③使用sklearn.datasets.load digits即可加载相关数据集

④参数
return_X_y:若为True,则以(data, target)形式返回数据;默认为False,表示以字典形式返回数据全部信息(包括data和target)。

⑤n_ class(特别的属性):表示返回数据的类别数,如:n_class=5,则返回0到4的数据样本。

5.sklearn库的基本功能

①sklearn库的共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。
②分类任务
在这里插入图片描述

③回归任务
在这里插入图片描述
④聚类任务
在这里插入图片描述
⑤降维任务
在这里插入图片描述

总结

本篇干货不多,这里只是简单概述,之后会以实例对这些算法的使用方式进行具体介绍。
将分为无监督学习,有监督学习,强化学习进行具体介绍
下一篇介绍:机器学习之无监督学习,将结合实例及代码详述聚类、降维、基于聚类的整图分割实例

如有错误,欢迎指正!

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
### 回答1: 机器学习是一门涉及数据处理和模式识别的学科,它通过构建和训练模型来进行预测和分类。而MATLAB作为一种功能强大的计算机编程语言,具备丰富的数据处理和分析工具,因此成为了机器学习中常用的工具之一。 MATLAB提供了多种机器学习的实践应用源码,供初学者进行入门学习和实践。学习者可以通过这些源码了解机器学习的基本原理和流程,以及如何将其应用于实际问题中。 MATLAB的机器学习实战源码通常涵盖以下内容: 1. 数据预处理:通过MATLAB的数据处理函数,对原始数据进行清洗、归一化等预处理操作,以减少噪声的影响,并保证数据的可靠性和一致性。 2. 特征选择:根据问题的需求和特征的相关性,选择最具代表性的特征集,以提高分类和预测的准确度。 3. 模型训练:使用MATLAB的机器学习工具箱,选择相应的模型算法进行训练。常见的算法包括线性回归、逻辑回归、支持向量机、决策树等。 4. 模型评估:使用交叉验证、混淆矩阵等评估指标,对训练出的模型进行评估,判断其预测和分类的准确度。 5. 结果可视化:利用MATLAB的绘图函数,对机器学习模型的结果进行可视化展示,以便更直观地理解和分析。 通过实践应用源码,学习者可以在实际操作中深入理解机器学习的原理和算法,并掌握如何使用MATLAB进行数据处理、模型训练和结果评估。这也为进一步深入研究和应用机器学习奠定了基础。 ### 回答2: 机器学习是人工智能领域的重要分支,通过训练模型和算法来使机器能够自动学习和提高性能。机器学习应用非常广泛,包括图像识别、自然语言处理、推荐系统等等。 在机器学习的实践中,MATLAB 是一种常用的工具。MATLAB 具有丰富的机器学习函数和工具箱,可以帮助用户快速实现算法和模型。 要进行机器学习的实战,首先需要学习一些基本的概念和算法机器学习中的一些常见算法包括线性回归、逻辑回归、决策树、支持向量机、神经网络等。MATLAB 中都有相应的函数和工具箱可以使用。可以通过学习 MATLAB 的帮助文档和示例代码来掌握这些算法的使用方法和原理。 在实际应用中,可以使用 MATLAB 来处理数据、建立模型、进行训练和评估。首先,将数据导入到 MATLAB 环境中,可以使用 MATLAB 提供的数据处理函数进行数据清洗和预处理。然后,选择合适的算法和模型,使用 MATLAB 提供的函数进行训练和优化。训练完成后,可以使用测试数据对模型进行评估。MATLAB 提供了丰富的可视化函数,可以对结果进行可视化展示和分析。 除了基本的算法和模型,MATLAB 中还有一些专门的工具箱,例如深度学习工具箱和图像处理工具箱,可以更方便地进行相关任务的实现。 总而言之,MATLAB 是一个强大的工具,提供了丰富的函数和工具箱,可以帮助用户进行机器学习的入门到实战。通过学习 MATLAB 的相关函数和示例代码,掌握机器学习的基本概念和算法,并在实际应用中进行模型的训练和评估,可以更好地理解和应用机器学习的知识。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柠檬茶@

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值