机器学习算法
csdn_SUSAN
成长才是最重要的!
展开
-
回归和分类模型性能评估指标MSE,MAE,PR,ROC,AUC
文章目录0. 模型评估是什么,为什么1. 不同类型问题的评估指标0. 模型评估是什么,为什么模型评估其本质是为了解决模型的泛化问题,由于各种原因,训练完成的模型可能会产生过拟合和欠拟合问题,因此需要对模型评估其泛化能力,并进行合适的参数调整以求得模型最优。为什么要进行模型评估?除了考虑到模型泛化能力的问题,同时也要兼顾不同业务场景下的业务指标不同。对于不同的业务场景,选择对应的评估指标,可...原创 2020-01-07 15:04:13 · 7631 阅读 · 0 评论 -
熵和信息
文章目录0. 序言1. 熵(entropy)的定义1.1 描述1.2 定义2. 信息的定义2.1 描述2.2 定义3. 概率的定义4. 算一算4.1 对人计算4.2 对事计算5. 参考文献0. 序言 在学习决策树的时候,决策树的分裂特征选择使用的启发函数,用到了熵这个概念。单纯的记忆公式只能知其然,而为了进一步探究决策树为什么用熵这个概念去评估选择分裂特征,则需要从熵的根本定义开始。1. ...原创 2020-01-01 23:19:43 · 830 阅读 · 0 评论 -
机器学习模型---判别VS生成,概率VS非概率,参数VS非参数
文章目录1. 判别模型VS生成模型1.1 判别模型1.2 生成模型监督学习是机器学习中发展最为成熟的分支,不仅由于监督学习框架下有各种学习模型,更因为监督学习框架有着坚实的理论支撑。这套理论包括VC理论、PAC理论和PAC-Bayes理论,它们以概率的方式回答了哪些问题可以学习以及学习成功的概率多大的问题。下边从几个视角来对监督学习模型进行分类。1. 判别模型VS生成模型假设一组数据X和标...原创 2019-12-17 21:40:16 · 1627 阅读 · 0 评论 -
导数,偏导数,方向导数,梯度的理解---微积分数学基础
这里写自定义目录标题概述导数的概念偏导数的概念功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入概述我们在ML wee...原创 2019-05-14 08:43:26 · 16127 阅读 · 3 评论 -
TF-IDF算法从理论到sk-learn实践
文章目录1. TF-IDF 是什么2. TF-IDF 公式计算3. TF-IDF的应用3.1 余弦相似度3.2 提取文章摘要4. TF-IDF 优缺点5. SK-learn实战TF-IDF1. TF-IDF 是什么 TF-IDF简言之,就是对一篇文章提取关键词的算法。不论怎么将其复杂化定义,其本质都是计算特征词在文章中的重要程度。 第一步:想要考察一个词的重要程度,最简单的思路就是考察起...原创 2019-12-02 16:25:56 · 813 阅读 · 0 评论