Python入门机器学习

最新推荐文章于 2024-06-08 10:09:40 发布

小北的北

最新推荐文章于 2024-06-08 10:09:40 发布

阅读量118

点赞数

文章标签：算法人工智能大数据编程语言 python

本文链接：https://blog.csdn.net/weixin_38739735/article/details/109673551

版权

点击关注我哦

一篇文章带你学习基本要求以精通机器学习

机器学习，深度学习，数据科学和人工智能（AI）是当今最常用的流行语。这些主题的受欢迎程度每天都在上升。每个人、每个企业都在尝试向这些领域靠拢。据《财富》杂志统计，人工智能专家的招聘在过去四年中增长了74％。人工智能被视为当代的“最热门”工作。

这可能在我们的脑海中引发许多问题：是什么让它如此受欢迎？这些领域到底是什么？什么是机器学习？我该如何开始？为什么是python？

我们将在今天的文章中尝试讨论这些问题，同时详细说明如何开始使用python和机器学习（ML）。

为什么AI如此受欢迎？

人工智能是当今增长最快的领域之一。人工智能的进步正在迅速发展。不缺少职位空缺和职业机会。每个人都对AI将如何成为下一件大事大肆宣传。正如吴安德教授所言，现代AI最杰出的人物之一“人工智能是新的电力。”由于技术的进步和数据的丰富，对现代AI领域的期望值很高。我们拥有更高质量的图形处理单元和更好的技术来计算复杂过程。

这些领域到底是什么？

人工智能是一个广阔的领域。机器学习，数据科学，统计，自然语言处理等主题都属于人工智能。深度学习是机器学习的子集。人工智能是“能够执行通常需要人类智力的任务的计算机系统的理论和开发，例如视觉感知，语音识别，决策和语言之间的翻译。”

在本文中，我们将重点放在机器学习上。我将尝试给出一种更直观的方法来理解机器学习。

什么是机器学习？

机器学习是程序自动学习和提高效率的能力，而无需明确地编程即可。这意味着，给定训练集，可以训练机器学习模型，并且它将了解模型的确切工作方式。在测试集，验证集或任何其他看不见的数据上进行测试后，模型仍将能够评估特定任务。

用一个简单的例子来理解这一点。假设有30,000个电子邮件的数据集，其中有些被归类为垃圾邮件，有些被归类为非垃圾邮件。机器学习模型将在数据集上进行训练。培训过程完成后，可以使用测试数据集中未包含的邮件对其进行测试。机器学习模型可以对以下输入进行预测，并且无论输入电子邮件是否为垃圾邮件，都可以对其进行正确分类。

机器学习方法主要有三种。下面将陈述一些示例和应用：

1. 监督学习

使用专门标记的数据集训练模型。数据集可以是二分类也可以是多分类。训练数据集是带有标记的数据，这些数据指定不同的分类。监督学习即在这些标记的数据帮助下进行了预训练。这种学习可以分为以下两种算法：

分类：当输出具有选择或特定类别时，首选这些算法。电子邮件垃圾邮件过滤的示例可以视为分类问题。
回归：当输出变量具有实数值时，首选算法。例如，可以预测特定位置的房价。

算法：回归算法（线性回归），决策树，随机森林和分类算法，例如K最近邻（KNN），支持向量机（SVM），逻辑回归，朴素贝叶斯。

应用：电子邮件垃圾邮件过滤，肿瘤分类（良性或恶性），用户评论分为正面评论或负面评论。

2. 无监督学习

无监督学习是在无标签数据集上训练模型。这意味着该模型没有任何先验信息。它通过将相似的特征和模式组合在一起来进行自我训练。无监督学习的一个例子是对猫和狗的分类。提供给我们的数据将是一个没有标签的数据集，其中包含狗和猫的图像。无监督算法将在模式和狗和猫的分组中找到相似之处，而无需指定数据类型。群集算法主要有以下两种类型：

聚类：将相似的实体排列成聚类组。如前所述，将猫和狗等类别归为一组的示例。另一个例子是根据特定数据确定癌症分期。
关联：在2个或多个班级/用户之间关联相似的模式。这样的示例是推荐系统，其中，如果特定的人观看特定类型的电影，则根据观看同一电影的其他用户喜欢观看的内容为用户提供推荐。亚马逊的另一个例子是，当亚马逊建议购买特定商品的买家也喜欢购买其他类似商品时。

算法： K-均值聚类，主成分分析（PCA），奇异值分解（SVD），分层聚类。

应用：亚马逊，Netflix，YouTube和其他数字平台中的推荐系统，Facebook上的朋友建议，异常检测。

3. 强化学习

根据维基百科上的介绍：强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以使累积奖励的概念最大化有关。除了监督学习和无监督学习，强化学习是三种基本的机器学习范式之一。

强化学习是一种即插即用的方法模型。这是模型学习反复失败的方法。当模型无法达到期望的结果时，模型将重新训练。这可以应用于像下棋的概念，在玩了数百万游戏之后，模型将能够学习适当的模式和动作。一个更简单的示例是井字游戏。经过几百场比赛，该模型可以学习每条通往胜利的道路，并且经过完美训练后，它永远不会输掉一场比赛。

算法：基于策略，基于价值和基于模型的强化学习算法。

应用：进行模型学习，如玩飞鸟，工业自动化中的机器人，交通控制，基于深度学习的强化学习。

应该如何开始？

机器学习入门的最佳方法是探索并更深入地研究围绕机器学习的各个主题。机器学习需要编程技能，数学知识，最重要的是需要学习的意愿和毅力。有大量的免费和付费资源，您可以从中获得很多知识。

为什么使用Python？

Python是一种面向对象的高级编程语言，具有高度的可解释性和效率。它非常优雅，易于学习且易于使用。Python是任何人的最佳方法，即使没有使用编程或编码语言的经验的人也可以开始使用机器学习。尽管存在一些缺陷，例如被认为是“慢”语言，但是python仍然是AI和机器学习的最佳语言之一。

尽管R等其他语言，Python之所以在机器学习中如此受欢迎的主要原因如下：