机器学习
文章平均质量分 90
机器学习前提知识+理论+实战
0xMayL
这个作者很懒,什么都没留下…
展开
-
机器学习和深度学习·贝叶斯优化和optuna
先验:取点取了n个点之后…后验:近似取得极值。原创 2024-08-29 12:41:05 · 1570 阅读 · 0 评论 -
机器学习·L2W4-决策树
提升方法训练多棵树,但它们彼此之间不再互不相关,而是一棵树接一棵树地拟合,以最小化误差。XGBoost 的一个有趣之处在于,在拟合过程中,它可以采用形式为 (X_val,y_val) 的评估数据集。学习率是梯度下降法的步骤大小,XGBoost 在内部使用该方法来最小化每个训练步骤中的误差。随机森林的另一个超参数称为 n_estimators,它是组成随机森林的决策树的数量。请记住,对于随机森林,我们随机选择特征子集并随机选择训练示例子集来训练每棵树。由于每棵树的拟合彼此独立,因此可以并行拟合多棵树。原创 2024-08-08 21:12:55 · 676 阅读 · 0 评论 -
机器学习·L3W2-协同过滤
推荐算法可以预测用户评分,并根据评分推荐数据。原创 2024-08-08 20:45:00 · 1225 阅读 · 0 评论 -
机器学习·L3W1-聚类和异常检测
计算每个样本点的正态分布概率密度,并且累乘得到最终概率,依据概率选择epsilon处理异常。公式是计算每一个聚类中心和当前样本的距离,挑选一个最短距离作为当前点的类别。参照分类模型的评估标准,选择F1分数最高的模型参数。异常检测是无监督学习,分类是有监督学习;一般采取计算样本的均值,使用。两层for循环直接暴力搜索。注意python的条件索引。利用python的判断语法。注意高斯函数算完后还要。距离不一定是欧式距离。原创 2024-08-08 15:31:58 · 975 阅读 · 0 评论 -
机器学习·L2W3-模型评估
60%训练集、20%测试集和验证集。原创 2024-08-07 11:06:38 · 754 阅读 · 0 评论 -
机器学习·概率论基础
分位数-分位数图是通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法横坐标是理论正态概率分布的百分数,纵坐标是数据概率分布的百分数具体定义如下。原创 2024-07-20 16:09:18 · 587 阅读 · 0 评论