【算法面试笔记】

本文详细探讨了机器学习面试中的关键点,包括特征工程的归一化和SVD、PCA,模型评估方法与超参数调优,以及如何防止神经网络过拟合。还涉及概率图模型、大数据处理策略和必要的数学知识,如概率论。
摘要由CSDN通过智能技术生成

特征工程

七种常用的特征工程
特征提取+数据预处理四部走

特征归一化

  1. 为啥要归一化
    百面机器学习上那个例子我觉得全
    就一个角度:
    让不同量纲的特征对最终模型有着近似、相似的影响力,可能不完全相同,保证特征之间的公平性
    以计算距离为例,很好理解,略
    以线性回归为例, w 1 x 1 + w 2 x 2 = y w_1x_1+w_2x_2=y w1x1+w2x2=y,损失就是 L = Σ i n ( w 1 x i 1 + w 2 x i 2 − y ˉ ) 2 L=\Sigma_i^n(w_1x_{i1}+w_2x_{i2}-\bar{y})^2 L=Σin(w1xi1+w2xi2yˉ)2,展开之后有 w 1 , w 2 w_1,w_2 w1,w2的二次项,还有一个交叉项,对 w 1 w_1 w1求导,倒数大概长这样 ∂ L ∂ w 1 = 2 A w 1 + B w 2 +
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值