机器学习
文章平均质量分 60
野指针小李
这个作者很懒,什么都没留下…
展开
-
hit@k 评价指标
hit@k 指的是在前 k 个结果中命中的概率。举例而言,假设我们在做 MLM (masked language model) 任务,输入:A bird usually has [MASK] legs. 真实标签为:two,输出的结果为:four: 0.321two: 0.178three: 0.114six: 0.064no: 0.063如果是用 hit@1 accuracy 作为评价指标,那么我们看前 1 个结果,是 four,那么 FN + 1;如果是用 hit@2 accura原创 2022-05-27 15:31:23 · 10073 阅读 · 0 评论 -
概率论与数理统计学习笔记(5)——极大似然估计
在机器学习与深度学习中,特别是"模型已定,参数未知"的情况下,普遍使用最大似然估计法学习参数。为了后面学习中能够找得到地方复习这些概率论知识,所以这里整理了极大似然估计的笔记,所有参考内容放在最后。对了宝贝儿们,卑微小李的公众号【野指针小李】已开通,期待与你一起探讨学术哟~摸摸大!目录1 似然与概率2 似然函数3 极大似然估计4 参考1 似然与概率似然(likelihood)与概率(probability)虽然经常在概率论中出现,但是我们看到两者名字是不同的,所以其含义是不同的。在我个人的知识.原创 2021-04-20 12:07:57 · 1250 阅读 · 0 评论 -
机器学习学习笔记(4)——macro-F1与micro-F1
本文以我自己的实验数据来作为样例说明何为macro F1与micro F1目录1 前置知识2 macro-F1与micro-F12.1 使用场景2.2 计算方法3 总结4 参考1 前置知识关于F1 score的内容如果还不清楚的朋友,可以参考我的上一篇博客:《机器学习学习笔记(1)——错误率、精度、准确率、召回率、F1度量》这里就只简单的提一下核心的混淆矩阵与公式:F1 score的公式:F1=2PRP+RF1 = \frac{2 P R}{P + R}F1=P+R2PR其中:PPP是.原创 2020-12-30 16:03:37 · 3365 阅读 · 0 评论 -
机器学习学习笔记(3)——量纲与无量纲,标准化、归一化、正则化
量纲、无量纲,标准化、归一化、正则化是我百度了很多次都不进脑子的知识,所以我决定还是放在博客上面。不过鉴于我查阅了很多资料,说是有许多的坑,所以我也不清楚我的理解和解释是否是坑,具体的就留给各位来帮忙评判了!目录1 量纲与无量纲1.1 量纲1.2 无量纲2 标准化3 归一化4 正则化5 总结6 参考1 量纲与无量纲1.1 量纲量纲我觉得最重要的一句话是:物理量的大小与单位有关。从这句话我们来思考下最核心的两个单词:大小、单位。就是说量纲是有两部分组成:数、单位。就比如1块钱和1分钱,就是两个.原创 2020-10-30 12:08:27 · 7292 阅读 · 4 评论 -
机器学习学习笔记(2)——ROC、AUC与loss公式的推导过程
ROC与AUC是我看的很累的一节,主要是公式推导过程太复杂了,并且南瓜书上也没有写的特别明白计算过程,于是我就自行推导了一次两个公式,并且还有些许自己的理解。本文使用的例子是南瓜书上的例子,南瓜书链接我会放在最后。目录一、ROC1. 概念2. 绘制方法2.1 我的方法2.2 书上的方法2.3 两者的关系2.4 性能评价二、AUC1. 概念2. 计算三、loss1. 概念2. 计算四、参考一、ROC1. 概念ROC全称是“受试者工作特征”(Receiver Operating Character.原创 2020-08-22 21:06:48 · 4015 阅读 · 4 评论 -
机器学习学习笔记(1)——错误率、精度、准确率、召回率、F1度量
本文是我在阅读西瓜书的时候的一些学习笔记和少许理解,更多的我个人觉得算是抛砖引玉吧,如果有误,请麻烦纠正。顺带说一句,自从看了《西瓜书》,再也不愁出去买到烂瓜了。本文内容是机器学习算法的性能度量,西瓜书上对性能度量的定义是:衡量模型泛化能力的评价标准。简单来说就是我们要怎样评价这个算法的优劣。目录一、混淆矩阵二、错误率与精度1. 错误率2. 精度三、准确率、召回率与F1度量1. 准确率2. 召回率3. F1度量四、参考一、混淆矩阵混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n.原创 2020-08-18 21:38:45 · 11453 阅读 · 11 评论