前言
Datawhale开源学习:机器学习,202406
一、第一章
1、了解到机器学习概念,主要是研究分析大量数据并得出其规律(简单点:函数的意思),另外深度学习以及强化学习都属于机器学习范畴;深度学习主要是采用了神经网络的机器学习方法。
2、了解机器学习里面基本概念术语:样本、标记、分类、回归、数据集、模型、泛化、分布:
(1)没有免费的午餐定理:不同算法的期望性能是一样的,需要针对具体学习问题去谈论算法。
(2)核心点:数据决定模型的上限,而算法则是让模型无限逼近上限。
二、第二章
3、基本概念术语:过拟合、欠拟合;
4、评估方法:留出法、交叉验证法、自助法、调参与最终模型。
5、性能度量:
(1)错误率与精度:错误率+精度=1;
(2)查准率与查全率:一堆相互矛盾的度量,以查准率为纵轴、查全率为横轴构建P-R曲线图;
(3)F1:平衡点是指查准率=查全率的时候;通过F_β来选择查准率和查全率的重要程度。
总结
机器学习终于开始入门了。感谢Datawhale小组所做的贡献:本次学习主要参考视频:https://www.bilibili.com/video/BV1Mh411e7VU