- 博客(4)
- 收藏
- 关注
原创 正则表达式 Regular Expression
d+或\D+:匹配一个或多个数字或非数字字符。\s+或\S+:匹配一个或多个空白或非空白字符。
2024-04-18 15:08:32
292
1
原创 梯度提升总结
首先理解集成学习,为了获得更好的预测性能,集成学习结合多个模型(弱学习器)的预测结果。利用和前向分布算法实现学习的优化过程。当损失函数是平方误差损失函数和指数损失函数时,每一步优化是很简单的。但对,往往。针对这一问题,Freidman提出了梯度提升(gradient boosting)算法。Gradient Boosting是Boosting中的一大类算法,它的思想借鉴于梯度下降法,其基本原理是根据当前模型损失函数的负梯度信息来训练新加入的弱分类器,然后将训练好的弱分类器以累加的形式结合到现有模型中。
2024-04-03 15:14:56
646
1
原创 机器学习分类问题评价指标
准确率:在预测小概率事件时,很具有误导性。实际为假的样本中有百分之多少被系统错分了。实际为真的样本中有百分之多少被系统错分为假了。实际为真的样本中有百分之多少被系统正确分为真了。所有系统预测为真的样本中有百分之多少实际上也是真的。Recall关注的是真正的正例中我们错过了多少,如果所有的正例我们都判断出来了,Recall值就是1。Precision关注的是系统预测为真的样本中有多少实际不是真的,如果系统预测出的正例全部真的是正例,那么Precision的值为1。
2024-03-19 19:49:59
779
原创 多分类混淆矩阵、准确率、精确率、召回率、F1值
对于分类模型的评价指标有:准确率accuracy、精确率precision、召回率recall和F1值。
2024-03-15 16:49:35
843
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人