机器学习
皮卡丘学算法
算法工程师·武汉大学
展开
-
01 决策树(DT)
决策树(DT) 1、定义决策树:决策 + 树我们的决策过程就像树的成长一样。由一个根(节点)不断的发散决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。 § 叶子节点:存放决策结果§ 内部节点:特征属性,及其对应输出,按照输出选择分支§ 决策过程:从根节点出发,根据数据的各个属性,计算结果,选择对应的输出分支,直到到达叶子节点,得到结果 ...原创 2018-04-13 20:38:32 · 708 阅读 · 0 评论 -
02 随机森林(RF)
随机森林(Random Forest,RF) 1、定义随机森林指的是利用多棵树对样本进行训练并预测的一种分类器随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为...原创 2018-04-13 20:43:45 · 599 阅读 · 0 评论 -
03 朴素贝叶斯(NBM)
朴素贝叶斯(Naive Bayesian Model)1、定义:贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。 贝叶斯法事概率论你框架下实施决策的基本方法,对分类任务来说,在所有相关概率都已知的情况下,如何运用这些概率来推测,分类 朴素贝叶斯最核心的部分是贝叶斯法则,而贝叶斯法则的基石是条件概率 条件概率公式设A,B是两个事件,...原创 2018-04-13 21:02:39 · 947 阅读 · 0 评论 -
04 支持向量机(SVM)
支持向量机(Support Vector Machine)1、定义支持向量机(Support Vector Machine,SVM)支持(support)向量(vector)指的就是样本点机器(Machine)支持向量机它是针对线性可分情况进行分析的,对于线性不可分的情况,它会将向量(样本)映射到一个更高维的空间里,在这个更高维空间里建立有一个最大间隔超平面,进行线性可分。通俗来讲,它是一种二类分...原创 2018-04-13 21:15:28 · 616 阅读 · 0 评论 -
05 神经网络(NNs)
神经网络(Neural Networks)1、定义神经网络是由具有适应性的 简单单元组成的 广泛并行互联的网络,它的组织能够模拟生物神经系统 对真实世界物体 所做出的交互反应。神经网络的基本组成部分是神经元模型。感知机——神经网络的基本组成单元 生物神经元 M-P神经元 生物神经元通过树...原创 2018-04-13 21:26:50 · 3493 阅读 · 0 评论 -
06 K均值(K-Means)
引子:聚类算法的简介 聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无监督的学习算法,而分类算法属于监督的学习算法。 在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。K均值(K-Means)1、定义K-me...原创 2018-04-13 21:36:59 · 647 阅读 · 0 评论 -
00 机器学习 (ML)导论
机器学习 (Machine Learning)1、定义机器学习 (Machine Learning) 是近 20 多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。简而言之,机器学习是通过学习老知识(训练样本),得出自己的认知(模型),去预测未知的结果。从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意...原创 2018-04-13 21:47:31 · 230 阅读 · 0 评论 -
Word2vec和Doc2vec原理理解并结合代码分析
一直在用Word2vec和Doc2vec做Word Embedding和Sentence/Document EMbedding,但是刚开始用的时候对其原理一直是一知半解,只是知道怎么用而已。古人云:既要知其然,也要知其所以然。所以,结合作者论文,以及网上各位前辈的博客和开源代码之后,抽空写写自己对Word2vec和Doc2vec原理的理解,以及结合代码做一些分析。希望能够有用,有错误也请各位朋友批...转载 2018-09-12 09:43:06 · 2185 阅读 · 0 评论