updating...
分类问题
【KNN】
- 首先是距离问题,除了欧式距离(其中的各个分量即为评价指标),还有以下
- 曼哈顿距离
- 切比雪夫距离
- 标准化欧式距离
- 算法描述:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别
- 实例:
- 通过计算{搞笑,拥抱,打斗}向量距离,与"唐人街探案"最接近的5个电影大多属于喜剧片,即最终化为喜剧片的范围
回归问题
【linear regression】
- 特征:利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间的关系进行建模的一种分析方式
- 通过自变量个数再次分类:一个自变量为单变量回归,多自变量为多元回归
- 通用公式:
- 随机梯度下降。。