机器学习
伍肆柒547
知乎:伍肆柒
展开
-
ImageNet 中的Top-5正确率:
对一个图片,如果分类概率的前五中包含正确答案,即认为正确。否则认为错误。原创 2021-08-07 00:09:27 · 443 阅读 · 0 评论 -
维数灾难或者维数诅咒的含义
高维空间数据样本具有稀疏性举例来说,100个平均分布的点能把一个单位区间以每个点距离不超过0.01采样;而当维度增加到10后,如果以相邻点距离不超过0.01小方格采样一单位超正方体,则需要100^10=10^20个采样点:所以,这个10维的超正方体也可以说是比单位区间大10^18倍。另外,随着维数的增加,高维数据之间的度量会呈现出“集中”效应。分别随机生成个均匀分布的1维、2维和3维的样本,计算任意两个样本点之间的余弦距离度量,由图中距离值的分布可以看出,维数越高,任意两个样本点之间的度量接近.原创 2021-08-04 09:48:24 · 821 阅读 · 0 评论