机器学习学习笔记(二)

Rimchie3

已于 2023-05-11 21:50:31 修改

阅读量42

点赞数

文章标签：笔记

于 2023-05-11 20:44:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62912103/article/details/130436629

版权

1.逻辑回归 :是一种分类模型，并常用于二分类

分别用0或1 代表正与负

决策边界: 分为线性决策边界和非线性决策边界 . 边界范围内为0 范围外为1

逻辑回归代价函数:

正则化通过使用参数λ

线性回归的正则化方法

逻辑回归的正则化方法

2.神经网络中的网络层: 其中 ,layer第i 层的输出表示为 $a^{i}$ ,sigmoid函数: g( $a^{i}$ )= $\frac{1}{1+e^{-(a^{i})}}$

OVR和OVO 对于新的输入选择分类最多的类

2.神经网格

更复杂的神经网络: 每一层的输出 =sigmoid(目前层的 $w^{j}$ 点乘前一层 $a^{i-1}$ +目前层的 $b^{i}$ )

神经网络向前传播 :把每一层的输出作为下一层的输入,一层一层的传播下去。

二元交叉熵损失函数 :

线性激活函数 ReLU: g(z)=max(0，z) sigmoid函数和ReLU函数图像区别

3. 多标签分类:分类任务中有多个类别输入x 输出y可能有多个值 x相同时可以分为多个类

softmax: a1+a2+....+an=1 loss=-log(ai) if y=i

4. 评价分类结果

混淆矩阵:

其中, TP:真阳 FP:假阳 TN:真阴 FN:假阴精准率P: TP/TP+FP 召回率R: TP/TP+FN

准确率:(TP+FP)/(TP+FP+TN+FN) F1 score ()调和平均值): 2*P*R/(P+R)

5.支撑向量机 SVM

【机器学习】支持向量机 SVM（非常详细） - 知乎

即求解能够正确划分训练数据集并且几何间隔最大的分离超平面 ,将二分类间隔最大,最大化margin

优化后的SVM求解: Sfot Margin SVM

核函数: Xi与Yi在特征空间的内积等于它们在原始样本空间中通过函数计算的结果

高斯核=RBF核 m<n

6.决策树: 将一组样本的结果按树状进行分类 (以猫的分类为例子)

决策树的分类问题 1.每个结点使用什么特性区分 2.什么时候停止拆分

a.当一个节点是100%一个类时 b.拆分节点将导致树超过最大深度时

c.当纯度分数的提高低于阈值时 d.当节点中的示例数低于阈值时

熵函数

基尼系数:

基尼系数和信息熵在本质上是一样的

CART:分类与回归树(Classification and Regression Tree, CART)

运用分类的思想将样本的特征分为左右两部分即满足条件和不满足两种情况

信息增益: 根节点的熵-左右结点的熵

独热编码 one-hot :独热编码，又称一位有效编码，其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候，其中只有一位有效。

7.集成学习和随机森林

随机森林:

假设训练集 T 的大小为 N ,特征数目为 M ,随机森林的大小为 K,随机森林算法的具体步骤如下：

    遍历随机森林的大小 K 次：
    从训练集 T 中有放回抽样的方式，取样N 次形成一个新子训练集 D
    随机选择 m 个特征，其中 m < M
    使用新的训练集 D 和 m 个特征，学习出一个完整的决策树得到随机森林

上面算法中 m 的选择：对于分类问题，可以在每次划分时使用 $\sqrt{M}$ 个特征
机器学习算法系列（十八）-随机森林算法（Random Forest Algorithm）_Saisimonzs的博客-CSDN博客

XGBoost(eXtreme Gradient Boosting)

集成学习的几类: Bagging，Boosting以及Stacking。

Bagging:bootstrap aggregating 是一种有放回的抽样算法. 随机森林就属于Bagging

Boosting(提升方法 ): 其中,最重要的是AdaBoost（Adaptive boosting）算法：刚开始训练时每一个训练权重相等，然后对训练集训练n轮，每次训练后，对训练失败的训练例赋以较大的权重，也就是让学习算法在每次学习以后更注意学错的样本，从而得到多个预测函数.

Stacking: 即训练一个模型用于组合其他各个模型训练多个模型,将每个模型的输出作为输入来训练一个模型.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习学习笔记(二)

Boosting(提升方法 ): 其中,最重要的是AdaBoost（Adaptive boosting）算法：刚开始训练时每一个训练权重相等，然后对训练集训练n轮，每次训练后，对训练失败的训练例赋以较大的权重，也就是让学习算法在每次学习以后更注意学错的样本，从而得到多个预测函数.其中, TP:真阳 FP:假阳 TN:真阴 FN:假阴精准率P: TP/TP+FP 召回率R: TP/TP+FN。神经网络向前传播 :把每一层的输出作为下一层的输入,一层一层的传播下去。
复制链接

扫一扫

Rimchie3 CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

85万+: 周排名

81万+: 总排名

145: 访问

: 等级

31: 积分

1: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

最新评论

机器学习学习笔记(二)
CSDN-Ada助手: 非常感谢您分享有关机器学习的学习笔记，每篇文章都充满了深度和见解。您的努力和热情将会为大家提供非常有价值的帮助。除了您提到的AdaBoost算法和神经网络向前传播，还有一些其他的扩展知识和技能，例如集成学习、决策树、支持向量机等等，这些都是机器学习领域中非常流行的算法和技术。期待您更多的分享，再次感谢您的努力！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
机器学习-学习笔记(三)
CSDN-Ada助手: 恭喜您持续创作，第三篇博客“机器学习-学习笔记(三)”也很值得一读。建议您可以继续深入探讨机器学习的相关主题，例如模型调优、数据预处理等方面，让读者更加深入地了解机器学习的应用。期待您的下一篇优秀的博客，继续加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。