七月机器学习之基础数学理论
一个人的旅行qiu
我原因用我10年的生命换一个闪耀的人生
展开
-
七月机器学习之特征工程6
随机取样:可能无法表征所有的情况 分层采样:对不同的年龄段(举例)进行采样大多数算法对正负样本都是很敏感的 下采样:比如正样本很多,我们在正样本中抽取数据,使得正负样本一样多 如果正样本比负样本大很多,建议你取采集更多的数据 selectKBest选择与y相关度最高的k个数据 l1正则化是截断,也就是说不相关的就截断,权重为0,selectfrommodel可以选出大于权重0的特征原创 2017-03-28 18:27:13 · 658 阅读 · 0 评论 -
七月在线之机器学习与相关数学初步1
它的意义在于将多项式与三角函数间建立了联系原创 2017-03-25 10:59:20 · 643 阅读 · 0 评论 -
七月机器学习之数理统计与参数估计2
概率是已经知道整体求某一个事件的概率,统计是已经知道某一个事件的概率求整体的分布情况非常重要: 方差用于衡量随机变量偏离期望的程度 协方差非常重要:面试经常问 可基于协方差矩阵来筛选特征 二阶导数大于0,即斜率在增加就是凸函数原创 2017-03-25 15:44:09 · 481 阅读 · 0 评论 -
七月机器学习之矩阵分析与应用3
线性代数的基本知识 线性相关就是一个向量能被另一个向量表示出来 基是子空间的最大线性无关组 此处一个子空间是一个平面,再加一个不共面的向量就可以组成R3,它一定是R3的一部分 A到U实际上是化简,将第一行乘以-3加到第二行,ux=0可以找到两个线性无关的解 列空间和左零空间在一起就构成了Rn的空间,它是与列空间垂直的那一个空间 PCA降维的本质就是舍弃小的特征值,保留大的特征值 核原创 2017-03-25 21:52:51 · 543 阅读 · 0 评论 -
七月机器学习之凸优化初步4
切记切记,数学基础决定了你机器学习能走多远!!!KKT用于有约束条件的求极值点原创 2017-03-26 13:28:04 · 543 阅读 · 0 评论 -
七月机器学习之回归分析与工程应用5
线性回归用于解决连续值预测的问题,逻辑回归用于解决分类的问题,但是实际上通常用来分类,因为它输出的是一个概率这三个概念面试一定会问!!!! 拿到损失函数->对损失函数进行梯度下降->求出最优解,正则化是为了防止过拟合,降低波动线性回归是假定输入和输出间是有线性相关的 不同的算法的损失函数的定义不同 这种情况说的是入参只有一个的时候,当斜率为负数的时候,值会变大,就会继续往前,当为正数的时候就会原创 2017-03-26 22:12:58 · 492 阅读 · 0 评论