HEU机器学习基础0.01
算法概述
文章目录
前言
Preview
based on Andrew Ng
key words:
inputs
outputs
label
监督学习Supervised learning
回归算法Regression
一般用于预测结果
算法模型通过学习input 与 output 的对应(大量正确事例)
Learns from being given “right answers”
即模型“学习”正确结果“right answers”数据集
达到通过给出的输入input,得到正确的输出output
即只读取input(可以是从未见过的全新的输入),给出一个合理准确的预测或猜测output
分类算法Classification
回归与分类的区别
回归:从无数个可能的label中选择一个最符合的label
分类:从有限个label中选择一个最符合的label
无监督学习Unsupervised learning
Data only comes with inputs x, but no output labels y
Algorithm has to find structure in the data
即 无监督学习的目标是得到分类标准Structure,而非分类的结果
与监督学习区别:
监督学习的数据集有“right answers”,最终要求得到可以得到一一对应label的算法
learn from data labeled with the “right answers”
无监督学习的数据集可以是unlabeled
Find something interesting in unlabeled data
聚类算法Clustering
不带标签地获取数据,并尝试将它们自动分组集中
Group similar data points together
异常检测Anomaly detection
Find unusual data points.
降维Dimensionality reduction
Compress data using fewer numbers