机器学习算法
文章平均质量分 69
qq_29622007
这个作者很懒,什么都没留下…
展开
-
机器学习数据预处理分布曲线
核密度估计(Kernel Density Estimation) 定义 核密度估计是估计随机变量的概率密度函数的非参数方法,即一种针对连续数据的密度估计方法,并且其根据数据本身的相互关系得到,无需对数据分布做假设。 假设样本彼此独立并遵循相同的分布。给定带宽H,每个样本都由平滑的核函数拟合。某数据的密度值可以视为其他所有样本对该数据的平均影响。 这里以高斯kernel为例。KDE对于数据里的每一个点,都画作一个高斯分布的波。然后对波进行叠加,于是数据密集的地方,波的高度就越高,数据越稀疏的地方,.原创 2022-02-10 15:25:04 · 646 阅读 · 0 评论 -
算法一些题目
1 简单 为什么要对特征做归一化 理解清楚特征归一化所适用的模型场景 2 中等 什么是组合特征?如何处理高维组合特征? 这里的特征组合主要指的是类别特征(Categorical Feature)之间的组合 3 中等 请比较欧式距离与曼哈顿距离? 比较曼哈顿距离和欧式...原创 2021-04-12 17:03:47 · 100 阅读 · 0 评论