机器学习算法
机器学习背后的数学和逻辑简介。
机器学习算法是一些代码片段,可帮助人们探索和分析复杂数据集并在其中找到意义。每个算法是一组有限的明确分步说明,计算机可以遵循这些说明来实现特定目标。在机器学习模型中,目标是建立或发现可用于预测或信息分类的模式。什么是机器学习?
机器学习算法使用基于训练数据(代表较大数据集的数据子集)的参数。训练数据越大,越能代表真实情况,从而算法计算出的结果也越准确。
不同的算法以不同的方式分析数据。算法通常按使用的机器学习技术(监督式学习、非监督式学习和强化学习)进行分类。最常用的算法使用回归和分类预测目标类别、查找异常数据点、预测值和发现相似性。
机器学习算法可识别数据中的模式,帮助数据科学家解决问题。机器学习算法可以预测值、识别异常情况、确定结构和创建类别。根据你所拥有的数据类型和想获得的结果,会用到不同的算法。算法通常按技术(监督式学习、非监督式学习或强化)或算法系列(包括分类、回归和聚类)进行分组。
机器学习技术
随着你逐渐了解机器学习算法,你会发现它们通常属于三种机器学习技术中的一种:
监督式学习
在监督式学习中,算法根据你提供的一组带标签的示例进行预测。当你知道结果会是怎样时,这种技术非常有用。
例如,你提供了一个包含过去 100 年每年城市人口数据的数据集,并希望了解特定城市在 4 年后的人口数量。结果使用数据集中已存在的标签:人口数量、城市和年份。
非监督式学习
在非监督式学习中,数据点没有标签,算法通过组织数据或描述其结构来为其添加标签。当你不知道结果会是怎样时,这种技术非常有用。
例如&