machine learning
文章平均质量分 91
extremebingo
这个作者很懒,什么都没留下…
展开
-
Expectation Maximization(EM)算法
EM算法的导出过程和详细的证明过程,并且将EM算法应用到高斯混合模型的参数估计中。原创 2017-11-01 19:38:09 · 590 阅读 · 0 评论 -
Semi-Supervised Support Vector Machines(S3VMs)
对于Semi-Supervised Support Vector Machines (S3VMs),即半监督支持向量机的直观理解是很简单的,如下图所示。在左图中,所有的数据都是有标签数据,所以可以使用SVM的最大化间隔来确定分离超平面。如果存在大量无标记的点,如右图所示,该如何确定分离超平面呢?如果还是采用左图所示的分离超平面,则分离超平面会将稠密的无标记数据切分成两个不同的类。但是根据图上的数据分原创 2018-01-10 10:44:36 · 3275 阅读 · 0 评论 -
Semi-Supervised Learning
简介半监督学习算法Self-Training ModelsMixture Models and EM有监督分类的混合模型半监督分类的混合模型EM算法求解THE ASSUMPTIONS OF MIXTURE MODELSCLUSTER-THEN-LABEL METHODSCo-Training协同训练THE ASSUMPTIONS OF CO-TRAININGGraph原创 2017-12-08 18:05:46 · 1749 阅读 · 0 评论 -
强化学习(Reinforcement Learning)
背景当我们思考学习的本质时,我们首先想到的可能是我们通过与环境的互动来学习。无论是在学习开车还是在交谈,我们都清楚地意识到环境是如何回应我们的行为的,我们试图通过行为来影响后续发生的事情。从互动中学习几乎是所有智能系统的理论基础。Reinforcement learning 是机器学习里面的一个分支,善于控制一个能够在某个环境下 自主行动 的个体,通过和 环境 之间的互动,不断改进它的 行为。强化学原创 2018-03-12 23:31:34 · 32529 阅读 · 0 评论 -
贝叶斯分类器
贝叶斯的相关介绍原创 2018-04-19 16:59:52 · 291 阅读 · 0 评论 -
提升方法之AdaBoost
对于一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独的判断好。实际上就是“三个臭皮匠顶个诸葛亮”的道理。提升方法中最具代表性的算法是AdaBoost。原创 2018-05-03 15:58:07 · 334 阅读 · 0 评论 -
孤立森林(Isolation Forest)
背景现有的异常检测方法主要是通过对正常样本的描述,给出一个正常样本在特征空间中的区域,对于不在这个区域中的样本,视为异常。这些方法的主要缺点是,异常检测器只是正常样本的最优描述,但是对于检测异常并不是最优的,有可能造成大量的误报,或者只检测到少量的异常。异常的两个特点:异常数据只占很少量、异常数据特征值和正常数据差别很大。孤立森林,不再是描述正常的样本点,而是要孤立异常点,由周志华教授...原创 2018-05-01 22:26:04 · 90457 阅读 · 26 评论 -
机器学习之混合类型数据的使用
在机器学习中,不同类型的数据(numeric, categorical, Continuous and Text data)的混合使用,一直是机器学习中数据处理的难点,处理的方式可能对模型的效果产生重要的影响。神经网络很强大,但是也没办法直接处理类别型的变量,需要经过如one-hot编码的预处理之后才能放进网络去训练。Understanding Categorical Data类别...原创 2018-05-22 21:15:37 · 11033 阅读 · 3 评论 -
OpenAI Gym构建自定义强化学习环境
OpenAI Gym由两部分组成:gym开源库:测试问题的集合。当你测试增强学习的时候,测试问题就是环境,比如机器人玩游戏,环境的集合就是游戏的画面。这些环境有一个公共的接口,允许用户设计通用的算法。 OpenAI Gym服务。提供一个站点(比如对于游戏cartpole-v0:https://gym.openai.com/envs/CartPole-v0)和api,允许用户对他们的测试结果进...原创 2018-07-01 20:55:27 · 37647 阅读 · 25 评论