【五一创作】机器学习

最新推荐文章于 2024-09-10 18:37:45 发布

开摆哥

最新推荐文章于 2024-09-10 18:37:45 发布

阅读量80

点赞数

文章标签：机器学习人工智能 python

本文链接：https://blog.csdn.net/2301_77762081/article/details/130445089

版权

监督式学习用于基于已知输入和输出数据建立预测模型，如分类和回归问题。无监督学习则在未标记数据中寻找隐藏模式，如聚类分析。选择算法取决于数据类型和目标。机器学习在大数据场景中至关重要，广泛应用于多个行业，如医疗、零售和信号处理。

摘要由CSDN通过智能技术生成

监督式学习

监督式机器学习能够根据已有的包含不确定性的数据建立一个预测模型。监督式学习算法接受已知的输入数据集（包含预测变量）和对该数据集的已知响应（输出，响应变量），然后训练模型，使模型能够对新输入数据的响应做出合理的预测。如果您尝试去预测已知数据的输出，则使用监督式学习。\n\n监督式学习采用分类和回归技术开发预测模型。\n\n分类技术可预测离散的响应 — 例如，电子邮件是不是垃圾邮件，肿瘤是恶性还是良性的。分类模型可将输入数据划分成不同类别。典型的应用包括医学成像、语音识别和信用评估。\n\n如果您的数据能进行标记、分类或分为特定的组或类，则使用分类。例如，笔迹识别的应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中，无监督模式识别技术用于对象检测和图像分割。\n\n回归技术可预测连续的响应 — 例如，温度的变化或电力需求中的波动。典型的应用包括电力系统负荷预测和算法交易。\n\n如果您在处理一个数据范围，或您的响应性质是一个实数（比如温度，或一件设备发生故障前的运行时间），则使用回归方法。\n\nSupervised Machine Learning了解如何使用有监督机器学习来训练模型，将输入映射到输出，并预测对新输入的响应。\n\n无监督学习\n无监督学习可发现数据中隐藏的模式或内在结构。这种技术可根据未做标记的输入数据集得到推论。\n\n聚类是一种最常用的无监督学习技术。这种技术可通过探索性数据分析发现数据中隐藏的模式或分组。聚类分析的应用包括基因序列分析、市场调查和对象识别。\n\n例如，如果移动电话公司想优化他们手机信号塔的建立位置，则可以使用机器学习来估算依赖这些信号塔的人群数量。一部电话一次只能与一个信号塔通信，所以，该团队使用聚类算法设计蜂窝塔的最佳布局，优化他们的客户群组或集群的信号接收。\n\nUnsupervised Machine Learning概要了解无监督机器学习如何在不带标注响应的数据集中找出规律。当您不确定数据包含哪些信息时，可以使用这种方法探查数据。\n\n如何确定使用哪种机器学习算法？\n选择正确的算法看似难以驾驭——需要从几十种监督式和无监督机器学习算法中选择，每种算法又包含不同的学习方法。\n\n没有最佳方法或万全之策。找到正确的算法只是试错过程的一部分——即使是经验丰富的数据科学家，也无法说出某种算法是否无需试错即可使用。但算法的选择还取决于您要处理的数据的大小和类型、您要从数据中获得的洞察力以及如何运用这些洞察力\n\n下面是选择监督式或者无监督机器学习的一些准则：\n\n在以下情况下选择监督式学习：您需要训练模型进行预测（例如温度和股价等连续变量的值）或者分类（例如根据网络摄像头的录像片段确定汽车的技术细节）。\n\n在以下情况下选择无监督学习：您需要深入了解数据并希望训练模型找到好的内部表示形式，例如将数据拆分到集群中。\n\n机器学习为什么重要\n随着大数据应用增加，机器学习已成为解决以下领域问题的一项关键技术：\n\n汽车\n\n航空航天和国防\n\n工业自动化和机械\n\n医疗设备\n\n信号处理\n\n更多数据、更多问题、更好的解答\n\n机器学习算法能够在产生洞察力的数据中发现自然模式，帮助您更好地制定决策和做出预测。医疗诊断、股票交易、能量负荷预测及更多行业每天都在使用这些算法制定关键决策。例如，媒体网站依靠机器学习算法从数百万种选项中筛选出为您推荐的歌曲或影片。零售商利用这些算法深入了解客户的购买行为。\n\n何时应该使用机器学习？\n当您遇到涉及大量数据和许多变量的复杂任务或问题，但没有现成的处理公式或方程式时，可以考虑使用机器学习。