初识机器学习

重生之菜鸟猿爱吃生蚝

已于 2024-05-16 00:30:16 修改

阅读量747

点赞数 14

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-05-16 00:29:48 首次发布

本文链接：https://blog.csdn.net/m0_74826183/article/details/138927560

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

主要是分享什么是机器学习，以及机器学习的生活之中的应用。

也会区别什么是监督学习以及无监督学习。

这也是自己开始学习机器学习的第一次记录。

机器学习

机器学习的发展历程

机器学习实际上已经存在了几十年或者也可以认为存在了几个世纪。追溯到17世纪，贝叶斯、拉普拉斯关于最小二乘法的推导和马尔可夫链，这些构成了机器学习广泛使用的工具和基础。1950年（艾伦.图灵提议建立一个学习机器）到2000年初（有深度学习的实际应用以及最近的进展，比如2012年的AlexNet），机器学习有了很大的进展。

从20世纪50年代研究机器学习以来，不同时期的研究途径和目标并不相同，可以划分为四个阶段。

第一阶段是20世纪50年代中叶到60年代中叶，这个时期主要研究“有无知识的学习”。这类方法主要是研究系统的执行能力。这个时期，主要通过对机器的环境及其相应性能参数的改变来检测系统所反馈的数据，就好比给系统一个程序，通过改变它们的自由空间作用，系统将会受到程序的影响而改变自身的组织，最后这个系统将会选择一个最优的环境生存。在这个时期最具有代表性的研究就是Samuet的下棋程序。但这种机器学习的方法还远远不能满足人类的需要。

第二阶段从20世纪60年代中叶到70年代中叶，这个时期主要研究将各个领域的知识植入到系统里，在本阶段的目的是通过机器模拟人类学习的过程。同时还采用了图结构及其逻辑结构方面的知识进行系统描述，在这一研究阶段，主要是用各种符号来表示机器语言，研究人员在进行实验时意识到学习是一个长期的过程，从这种系统环境中无法学到更加深入的知识，因此研究人员将各专家学者的知识加入到系统里，经过实践证明这种方法取得了一定的成效。在这一阶段具有代表性的工作有Hayes-Roth和Winson的对结构学习系统方法。

第三阶段从20世纪70年代中叶到80年代中叶，称为复兴时期。在此期间，人们从学习单个概念扩展到学习多个概念，探索不同的学习策略和学习方法，且在本阶段已开始把学习系统与各种应用结合起来，并取得很大的成功。同时，专家系统在知识获取方面的需求也极大地刺激了机器学习的研究和发展。在出现第一个专家学习系统之后，示例归纳学习系统成为研究的主流，自动知识获取成为机器学习应用的研究目标。1980年，在美国的卡内基梅隆（CMU）召开了第一届机器学习国际研讨会，标志着机器学习研究已在全世界兴起。此后，机器学习开始得到了大量的应用。1984年，Simon等20多位人工智能专家共同撰文编写的MachineLearning文集第二卷出版，国际性杂志Machine Learning创刊，更加显示出机器学习突飞猛进的发展趋势。这一阶段代表性的工作有Mostow的指导式学习、Lenat的数学概念发现程序、Langley的BACON程序及其改进程序。

第四阶段20世纪80年代中叶，是机器学习的最新阶段。这个时期的机器学习具有如下特点：

（1）机器学习已成为新的学科，它综合应用了心理学、生物学、神经生理学、数学、自动化和计算机科学等形成了机器学习理论基础。

（2）融合了各种学习方法，且形式多样的集成学习系统研究正在兴起。

（3）机器学习与人工智能各种基础问题的统一性观点正在形成。

（4）各种学习方法的应用范围不断扩大，部分应用研究成果已转化为产品。

（5）与机器学习有关的学术活动空前活跃。

什么是机器学习

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

机器学习被视为人工智能的一个子集，是人工智能的核心，是使计算机具有智能的根本途径。

机器学习的核心思想是利用算法和统计学的方法来让计算机在没有人类干预的情况下从数据中“学习”到模式，并使用这些模式来进行自主的预测和决策。具体来说，机器学习算法通过构建一个基于样本数据的数学模型（称为“训练数据”）来进行预测或决策，而这个模型是通过对大量数据进行分析和学习得到的。

机器学习可以分为几类，包括监督学习、无监督学习和增强学习等。监督学习是指通过已知的数据集（包括输入和输出）来训练模型，使得模型能够根据新的输入数据预测出相应的输出。无监督学习则是指在没有已知输出的情况下，通过学习数据的内在结构和规律，来发现数据的模式和特征。增强学习则是一种通过让计算机在不断尝试和错误中学习如何做出决策的方法。

图片源于百度

机器学习的日常应用

图像识别：当我们使用智能手机进行人脸识别、拍照搜索或AI换脸等功能时，背后都有机器学习的支持。例如，人脸识别技术可以用于解锁手机、支付验证等场景。
语音识别：在社交应用（如微信、QQ）中，我们可以使用语音输入并转换为文字，这种自动语音转换为文字的方式就是机器学习的应用。此外，智能音箱如小爱同学、天猫精灵等也利用了语音识别技术。
流量预测：当我们使用地图应用（如百度地图）查询路线时，它会根据历史数据预测交通状况，为我们规划最优路线。
推荐系统：在电子商务（如淘宝、京东）和社交媒体（如抖音、微博）等平台中，机器学习算法会根据我们的历史行为和偏好推荐商品、内容等。
自动驾驶：自动驾驶汽车是机器学习最令人兴奋的应用之一。它们通过摄像头、雷达等传感器收集环境数据，利用机器学习算法进行视觉感知、路况识别等，实现自主驾驶。
垃圾邮件和恶意软件过滤：每当我们收到一封新邮件时，机器学习算法会自动将其分类为重要邮件、普通邮件或垃圾邮件。类似地，杀毒软件也会利用机器学习技术来检测恶意软件。
虚拟个人助理：如Siri、小爱同学等虚拟助手，可以回答我们的问题、提供信息、设置提醒等，这些功能都依赖于机器学习技术。
医疗诊断：机器学习在医疗领域的应用也日益广泛，例如用于癌症诊断、疾病预测等。通过分析患者的医疗影像、基因数据等信息，机器学习算法可以帮助医生更准确地诊断疾病。
金融风控：在金融行业，机器学习被用于欺诈检测、信用评估等场景。通过分析用户的交易记录、信用历史等信息，机器学习算法可以帮助银行识别潜在的风险并采取相应的措施。

其实不知不觉之中很多人工智能已经无处不在生活之中，其实也是在开始学习的时候才发觉这个时候

监督学习

监督学习，也被称为监督机器学习，是机器学习和人工智能的一个子类。它的定义是使用标记数据集来训练算法，以便对数据进行分类或准确预测结果。当输入数据被输入到模型中时，它会调整其权重，直到模型被适当地拟合，这是交叉验证过程的一部分。监督式学习可以帮助组织大规模地解决各种现实世界的问题，例如对收件箱中单独文件夹中的垃圾邮件进行分类。

在监督学习中，每个实例都是由一个输入对象（通常为矢量）和一个期望的输出值（也称为监督信号）组成。

监督学习算法是分析该训练数据，并产生一个推断的功能，其可以用于映射出新的实例。监督学习是机器学习和人工智能的一个子类，它的定义是使用标记数据集来训练算法，以便对数据进行分类或准确预测结果。

其实也是我们训练大模型当中一个运用，个人认为有些类似哈，如果说的有不对的，希望uu们可以指出来。当我们去训练大模型，我们会提前海量的进行打标签，其实我们打标签就是类似于一种标记的做饭，这样的话，就是进行监督学习。

监督学习的主要特点是既有输入，也有结果。通过学习系统得到一个模型，得到一个y和x的函数关系，或者一个条件概率模型，即y在x的前提下发生的概率。监督学习主要包括分类和回归，当输出被限制为有限的一组值（离散数值）时使用分类算法；当输出可以具有范围内的任何数值（连续数值）时使用回归算法。

图片取自于知乎

监督学习在许多领域都有重要的应用，例如图像识别、语音识别、推荐系统、自动驾驶、医疗诊断等。

无监督学习

现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。

无监督学习（Unsupervised Learning）用算法来分析并聚类未标记的数据集，以便发现数据中隐藏的模式和规律，而不需要人工干预（因此，被称为“无监督的”学习）。

无监督学习是机器学习的分支之一，主要分为聚类算法和降维算法。

无监督学习里典型例子是聚类。聚类的目的在于把相似的东西聚在一起，而我们并不关心这一类是什么。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

聚类算法一般有五种方法，最主要的是划分方法和层次方法两种。划分聚类算法通过优化评价函数把数据集分割为K个部分，它需要K作为输入参数。典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。层次聚类由不同层次的分割聚类组成，层次之间的分割具有嵌套的关系。它不需要输入参数，这是它优于分割聚类算法的一个明显的优点，其缺点是终止条件必须具体指定。典型的分层聚类算法有BIRCH算法、DBSCAN算法和CURE算法等。

下面是简单的示意图。

图片来自于知乎

其实无监督学习仍然需要人工干预来验证它的输出是否合理。比如数据分析人员需要验证电商推荐引擎将婴儿服装与尿不湿、苹果酱和吸管杯分组是否有实际意义。反过来，如果有一天，算法把两个我们人类看起来毫不相关的两种商品分类到一起，那我们或许会发现某种人类的潜在需求，我们需要认真对待这种分类，但这种潜在需求是否真的存在，我们尚且不知，仍需要市场去检验，但这至少启发了我们。（这段话来源于知乎博主7号床）

主要是通过b站来进行学习-分享一下学习的博主是：啥都会一点的研究生

不过主要是偏向一些理论的知识，大家如果有更好的建议，大家都可以分享嘞。