机器学习machine learning（2）| 基础知识点梳理

最新推荐文章于 2022-11-20 15:06:14 发布

Ghost1898688

最新推荐文章于 2022-11-20 15:06:14 发布

阅读量656

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能数据分析算法

本文链接：https://blog.csdn.net/Ghost1898688/article/details/106168537

版权

学习完机器学习，把知识点做一个整理，提供给需要面试的各位以及后期自己的巩固复习作一个简单的知识点梳理。
本文针对有一定机器学习基础的同学，如果有不正确处请指正。

异常值/缺失值

归一化、标准化

文字编码独热化，时间sin化

特征选择

总结：一般来说，过滤法更快，但是粗糙。后两者更准确但是比较慢。当数据量很大时，优先使用方差过滤和互信息法。使用逻辑回归时，用嵌入法。使用SVM时，用包装法。迷茫的时候，从过滤法走起。

降维

PCA：衡量指标是对角线，对角线上是方差，利用特征值分解映射新维度，不可解释
SVD：衡量指标是奇异值，对角线上是奇异值，利用奇异值分解映射新维度，减少计算量
LDA：找到有判别力的维度映射，相似的特征映射在一起
PCA与LDA之间的差别：PCA和LDA虽然都用到数据降维的思想，但是监督方式不一样，目的也不一样。PCA是为了去除原始数据集中冗余的维度，让投影子空间的各个维度的方差尽可能大，也就是熵尽可能大。LDA是通过数据降维找到那些具有有判

关注