机器学习
TangowL
这个作者很懒,什么都没留下…
展开
-
主动学习 Active Learning - a survey
知识点解释1. 分析机器学习算法的可学习性时,通常有 realizable-assumption 和 non-realizable-assumption。前者表示假设空间中存在 ERM 为零的最优模型,后者表示假设空间中不存在。显然后者更符合真实情况。2. PAC 理论用严格的形式化语言描述了上述两种情况的 sampl...原创 2020-10-10 09:55:12 · 699 阅读 · 0 评论 -
分布式机器学习的故事
王益博士,称得上机器学习领域的资深从业者,本人之前有幸拜读过王益博士的一些paper和slides,对其从事的“分布式机器学习”方向尤感兴趣。王益博士之前写过一篇《分布式机器学习的故事》,总结了自己从业多年的经验和感悟。可惜的是,这篇原始博文已经删除了,现在能找到的是原始的六篇讲稿素材:A New Era;Infrequent itemset mining;Application Driven;Im原创 2016-11-07 12:08:58 · 12558 阅读 · 6 评论 -
机器学习知识地图 —— 概述
自己整理的知识地图,有兴趣的可以看看原创 2018-04-09 23:46:37 · 1463 阅读 · 0 评论 -
机器学习知识地图 —— 模型评估和选择
自己整理的知识地图,有兴趣的可以看看原创 2018-04-09 23:50:31 · 479 阅读 · 2 评论 -
机器学习知识地图 —— 数值计算
自己整理的知识地图,有兴趣的可以看看原创 2018-04-10 23:39:33 · 426 阅读 · 2 评论 -
机器学习知识地图 —— 监督学习(回归)
机器学习知识地图 —— 监督学习(回归)原创 2018-05-08 20:45:37 · 431 阅读 · 0 评论 -
机器学习知识地图 —— 监督学习(普通分类器)
自己整理的知识地图,有兴趣的可以看看原创 2018-05-08 20:48:59 · 522 阅读 · 0 评论 -
机器学习知识地图 —— 监督学习(集成分类器)
自己整理的知识地图,有兴趣的可以看看原创 2018-05-08 21:11:12 · 581 阅读 · 0 评论 -
学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点
Ranking 是信息检索领域的基本问题,也是搜索引擎背后的重要组成模块。本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理,包括 pointwise、pairwise、listwise 三大类型,它们的经典模型,解决了什么问题,仍存在什么缺陷。关于具体应用,可能会在下一篇文章介绍,包括在 QA 领域的实践情况。原创 2018-05-20 14:32:26 · 65858 阅读 · 8 评论 -
浅谈机器学习中的非线性
之前学习没有想透,最近交流时,在这个问题上磕绊了几次,打算仔细思考下。关于机器学习中的线性和非线性,有两个聚焦点,一个是问题,一个是模型。问题的线性非线性,指的是样本点的分布,是否能在输入空间Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...原创 2018-06-18 20:22:53 · 10386 阅读 · 1 评论 -
逻辑斯蒂回归中特征共线性或强相关的影响
理论解释共线性,指多元回归模型中,各自变量之中至少有两个完全或高度相关。一方面,自变量之间的强相关,虽不会影响对应回归系数的大小,但会扩大其回归系数的方差。由于回归系数比上标准差,即检验该回归系数是否显著的 t 值。由于 t 值的降低,导致回归系数不显著,将无法拒绝一个错误的零假设。另一方面,自变量之间的强相关,可能导致回归系数的正负方向与真实的相反,影响特征的可解释性。可以认为 ...原创 2018-09-06 21:05:24 · 8652 阅读 · 1 评论 -
概率图模型 —— 串连 NB、LR、MEM、HMM、CRF
概率图模型(PGM),作为机器学习的重要分支,能串连起很多传统模型,比如 NB、LR、MEM、HMM、CRF、DBN 等。本篇文章,从串连多个模型的角度,来谈谈 PGM,顺便把这些模型回顾下。原创 2018-10-23 00:14:32 · 2496 阅读 · 3 评论 -
机器学习 实践流程 思维导图
自己结合学习与实践,从机器学习实践出发,整理了整个流程,以思维导图的形式呈现,也方便自己以后查阅。原创 2016-04-16 14:27:18 · 3627 阅读 · 6 评论 -
GBDT(MART) 迭代决策树算法 深入浅出
GBDT(MART) 迭代决策树转载 2016-02-29 11:17:27 · 3506 阅读 · 2 评论 -
CART回归树&模型树 生成 剪枝 in Python
回归树算法 CART和模型树 生成 剪枝 in Python原创 2015-12-11 08:57:50 · 4753 阅读 · 0 评论 -
二分K-均值算法 bisecting K-means in Python
二分K-均值算法 bisecting K-means in Python原创 2015-12-15 21:31:05 · 3782 阅读 · 1 评论 -
机器学习基础
机器学习基础原创 2016-02-19 15:22:49 · 875 阅读 · 1 评论 -
支持向量机 SVM 算法推导优缺点 代码实现 in Python
总结和实现代码,费了很大功夫原创 2015-11-08 20:24:05 · 4137 阅读 · 1 评论 -
提升算法 AdaBoost元算法 提升树算法 in Python
提升算法 AdaBoost元算法 提升树算法 in Python原创 2016-02-21 14:21:01 · 1978 阅读 · 2 评论 -
关联分析的Apriori算法 in Python
关联分析的Apriori算法 in Python原创 2016-02-22 20:37:14 · 5731 阅读 · 1 评论 -
kd-tree in Python
kd树搜索改进 in Python原创 2016-03-20 20:33:51 · 5114 阅读 · 4 评论 -
朴素贝叶斯 Naive Bayes in Python
NBC总结与二分类的Python实现原创 2015-10-29 19:58:49 · 1847 阅读 · 2 评论 -
关联分析的FP-growth算法 in Python
关联分析的FP-growth算法 in Python原创 2016-02-25 11:32:54 · 4490 阅读 · 3 评论 -
基本线性回归、局部加权线性回归和缩减方法(岭回归、前向逐步回归) in Python
基本线性回归和局部加权线性回归、岭回归、前向逐步回归 in Python原创 2015-11-20 10:41:39 · 6446 阅读 · 2 评论 -
k近邻法 kNN算法 in Python
经典kNN算法概述和Python实现。原创 2015-10-28 20:47:48 · 1612 阅读 · 1 评论 -
决策树算法 生成 剪枝 in Python
决策树算法 生成 剪枝 in Python原创 2015-10-28 21:57:20 · 3313 阅读 · 5 评论 -
逻辑斯蒂回归 Logstic Regression in Python
不少内容借鉴了njustzj001博客的内容,致谢。原创 2015-11-02 21:13:24 · 4633 阅读 · 0 评论 -
《机器学习实战》 自制勘误表 中文版第一版2015年9月第11次印刷版
《机器学习实战》 自制勘误表 中文版 第一版2015年9月第11次印刷版原创 2015-12-11 09:59:54 · 4191 阅读 · 4 评论