机器学习主题思维导图
监督学习
在监督学习中,我们有一组训练数据作为输入,一组标签或每个训练集的“正确答案”作为输出。 然后我们正在训练我们的模型(机器学习算法参数)以正确地将输入映射到输出(以进行正确的预测)。 最终目的是找到这样的模型参数,即使对于新的输入示例,这些参数也能成功地继续正确的输入→输出映射(预测)。
回归
在回归问题中,我们进行实值预测。基本上,我们尝试沿着训练示例绘制一条线/平面/n 维平面。
使用示例:股价预测、销售分析、任意数字的依赖等。
实践代码
线性回归——例如:房价预测。
分类
在分类问题中,我们按特定特征分割输入示例。
使用示例:垃圾邮件过滤器、语言检测、查找相似文档、手写字母识别等。
实践代码
逻辑回归——示例:微芯片健康检测、使用一对多方法的手写数字识别。
无监督学习
无监督学习是机器学习的一个分支,它从尚未标记、分类或分类的测试数据中学习。 无监督学习不是响应反馈,而是识别数据中的共性,并根据每个新数据中这些共性的存在与否做出反应。
聚类
在聚类问题中,我们通过未知特征分割训练示例。算法本身决定用于分裂的特征。
使用示例:市场细分、社交网络分析、组织计算集群、天文数据分析、图像压缩等。
实践代码
K-means 算法——示例:将数据分成三个集群。
异常检测
异常检测(也称为异常值检测)是识别与大多数数据显着不同而引起怀疑的稀有项目、事件或观察结果。
使用示例:入侵检测、欺诈检测、系统健康监控、从数据集中移除异常数据等。
实践代码
使用高斯分布的异常检测——例如:检测过载的服务器。
神经网络
神经网络本身不是算法,而是许多不同机器学习算法协同工作并处理复杂数据输入的框架。
使用示例:作为一般所有其他算法的替代,图像识别、语音识别、图像处理(应用特定风格)、语言翻译等。
实践代码
神经网络:多层感知器 (MLP) — 示例:手写数字识别。
详情参阅 - 亚图跨际