自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【算法面经】《百面机器学习 算法工程师带你去面试》笔记

9.训练集和验证集划分:留出法(37分),k折交叉法,自助法(有放回n次抽样,36.8%)正则化、Dropout、扩充数据集、缩减模型、预训练fine-tune、集成学习。(2)GMM聚类:EM算法求解:假设每簇数据遵循正态分布(椭圆状)、生成式模型。外部:Jaccard指数(↑)、Rand指数(↑)、FM指数(↑)(3)聚类簇的定义:中心定义、密度定义、概念定义、连通定义。Min-max归一化:(x-min)/(max-min)CRF、HMM、最大熵模型、朴素贝叶斯模型、主题模型。

2023-11-30 14:47:46 1179

原创 【算法面经】统计学习方法笔记

(3)随机选取数据点,若误分类,修改w、b,直至正确分类。(2)半朴素贝叶斯模型:超父:至于其中一个属性有相关关系。Adaboost:加法模型、前向分步模型、指数损失函数。(1)生成式:Naïve Bayes,HMM,GMM。(2)Loss = 误分类点对超平面的距离之和。求大:信息增益 = H(D|A)-H(D)求大:信息增益率 = 信息增益/H(D)(2)求解标注问题:CRF,HMM。高斯核、正定核、字符串核、多项式核。(2)回归:R2-score。非概率模型:Y=f(X)(1)+1:拉普拉斯平滑。

2023-11-30 14:38:08 21

原创 【算法面经】西瓜书阅读笔记

输入样本扰动、模型参数扰动、输入属性扰动、输出表示扰动。多变量决策树:节点判断条件含有and 或者or。OvO、OvR可能会导致类别不平衡。功能神经元:含有激活函数的神经元。L1+逻辑回归:Lasso回归。L2+逻辑回归:Ridge回归。标准BP算法在DNN中难以收敛。节省训练开销:预训练、参数共享。β越大,Fβ对于召回率越关注。DNN的隐层层数通常>=8。预训练+fine-tune。ECOC编码具有容错能力。使得数据由稀疏变稠密。正则化方法或梯度裁切。Relu系列激活函数。

2023-11-30 14:35:32 21

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除