淼德利斯-CSDN博客

但如果实例梯度值小，误差就小，说明这个实例已经训练的很好了，直接的想法就是抛弃小梯度的数据，这样一来数据的分布就会发生改变，会损失学到的模型的精确度。EFB（独立特征合并），针对海量稀疏数据，根据数据间的冲突度（如cos夹角，0101和1010的冲突很小，因为非零位不相同，非零位不相同的占比越高，冲突度越少），对冲突度小的特征进行合并，变稀疏矩阵为稠密矩阵，减少特征维度；GOSS（基于梯度的单边采样），对海量学习数据，根据其梯度，筛除绝大部分的小梯度样本（几乎无更新作用），保持精度的同时加快速度；.....

2022-07-18 17:55:50 938

转载 ML算法选型

概念均方差 MSE mean square error平均绝对差 MAE mean absolute error交叉损失熵 cross entropy欠拟合：训练集和测试集性能接近过拟合：训练集远远高于测试集性能有监督学习算法比较knn调节：n_neighbors优点：模型很容易解释。缺点：局限：仅适用于小数据集。建议：预处理数据（将特征缩放到同一范围）能提高准确率。线性模型调节alpha或者C优点：对维度非常高的稀疏数据（如文本数据）表现好。训练和预测速度快。适用于非

2022-05-15 16:35:18 164

原创电商相关面试

抖音电商和淘宝的区别抖音确实已经是一款国民级产品，但抖音电商很多人还是不知道的，因为人们会误解抖音电商只是把一个产品视频发在了抖音上，或者只是靠抖音进行引流做微商，其实不是的。如果抖音电商一定要归类的话，它应该属于内容电商，就是通过内容进行带货，当然，抖音官方给了个更加洋气的定义“兴趣电商”。它绝对不是所谓的微商的升级版，也不是平台电商。下面我给大家介绍一下抖音和平台电商的区别，在我们的认知里面，淘宝是一个大市场，所有的买家和卖家都可以通过淘宝这个大市场进行交易，它是一个交易平台，对吧。那么抖音的

2022-04-05 10:38:14 2658

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

SDFAA1的博客

原创 AB test

原创说一说xgboost和lightgbm的区别是什么

转载 ML算法选型

原创电商相关面试

原创检验一个数据集是否是正太分布

原创 ROC 曲线的新使用方法

原创面试经验集

原创机器学习案例笔记

原创数据预处理之数据编码

原创 RF GBDT LGBM XGboost 调参各参数的重要性

DC 竞赛：《野蛮时代》游戏付费行为预测

空空如也