机器学习
daydaydreamer
写给我自己看的,公开是为了方便编辑
展开
-
数据之间的相似度的度量 马氏距离 欧氏距离 PCA相关
目前凭印象说一下,可能不准,反正说给我自己的哈哈、PCA就是找出一些特征的线性组合,这些线性组合能够有效地区分出不同数据点,数据点在这些PCA找出来的方向上的投影点方差最大(同时重建误差最小,参考PCA)欧氏距离是最直观最简单的,也就是两个点之间的几何距离,也就是原始数据各个维度上坐标值的差的平方之和标准化欧式距离是针对简单欧式距离的缺点而作的一种改进方案。标准欧式距离的思路:既然数据各维分...原创 2020-03-15 18:00:28 · 2484 阅读 · 0 评论 -
K折交叉验证 (cv)
之前一直理解错了我知道K折交叉验证是在模型选择过程(model selection)中用来评估候选模型的。把整个训练集分成k份,一共进行k次评估,每次用k-1份训练,用1份来验证。之前以为这k次是迭代的,其实不是!注意sklearn做交叉验证的时候,需要使用相同的estimator,所以用了clone!参考1参考2...原创 2020-03-12 19:24:16 · 1068 阅读 · 0 评论