机器学习
勿语~
种一棵树最好的时间是十年前,其次是现在。
展开
-
最大似然估计详解(转)
在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。似然函数在统计推断中有重大作用,如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“或然性”或“概率”又有明确的区分。概率 用于在已知一些参数...转载 2019-03-14 23:06:09 · 842 阅读 · 0 评论 -
机器学习各类算法思路总结五(Bagging、boosting)
BaggingBagging方法也称为汇聚法(Bootstrap Aggregating),属于集成学习中 平均方法中的一种Bagging的方法过程,在原始的数据集中进行随机抽样(可以放回抽样,也可以不放回抽样)使用得到的随机子集来训练评估器,该过程重复n次,每次训练得到一个评估器,最终聚合每个单独的评估器预测。预测会使用多数投票(分类)或者求均值(回归)的方式来统计最终的结果(平均方法...原创 2019-04-24 17:22:43 · 2012 阅读 · 0 评论 -
机器学习各类算法思路总结四(决策树与随机森林、集成学习了解)
决策树简单来说,决策树,就是将数据集转化为一棵树,按照这棵树的规则,对于样本进行归类。决策树是一种非参数监督学习方法,用于分类与回归。 目标是创建一个模型,从数据特征中进行学习,进而推断出的简单决策规则,用来预测目标变量的值。决策树是一种树形结构,通过做出一系列决策(选择)来对数据进行划分,这类似于针对一系列问题进行选择。决策树的决策过程就是从根节点开始,测试待分类项中对应的特征属性,并...原创 2019-04-23 15:35:12 · 890 阅读 · 0 评论 -
机器学习各类算法思路总结二(梯度下降与数据标准化)
梯度下降求梯度,实际上,就是求导数,函数在某一个点处求偏导。当函数是一维函数的时候,梯度就是导数。梯度下降,实际上就是在比喻下山的过程。一个人被困在了山上,要下山,从山坡往山的最低点处走,但是山中的浓雾很大,路径无法确定,所以就必须利用自己周围的信息去找出下山的路径,这个时候,就可以利用梯度下降的知识来帮助自己下山。具体的说,就是以自己当前的路径为准,寻找位置最陡峭的地方,然后朝着山的高度下...原创 2019-04-17 17:56:53 · 865 阅读 · 0 评论 -
机器学习各类算法思路总结三(逻辑回归与KNN、KD树)
逻辑回归首先,要明确的是,逻辑回归并不是监督学习中的回归类算法,是属于监督学习中的分类型算法逻辑回归,不但可以能够进行分类,而且还能够获取属于该类别的概率监督学习的思想,通俗的讲,就是为所有的样本,一一进行打分,然后设置一个阈值,按照按照阈值为分隔点,将样本分隔为不同的类别(达到阈值的一类,不达到的一类)而,为样本打分的这一步,实际上和线性回归算法是一致的,都是利用最大似然估计,得到所有...原创 2019-04-22 11:04:02 · 1081 阅读 · 0 评论 -
机器学习各类算法思路总结一(监督-回归部分)
机器学习的分类监督学习分类回归无监督学习聚类降维半监督学习强化学习机器学习(监督)的基本概念机器学习,就是让电脑模仿人进行学习人在做任何事,也需要学习,比如说考试,需要看文档或者查资料,再或者有人传授。那么这个人在文档中、资料中、听课中,得到一个一个个的问题,以及这些问题所对应的正确答案,对自己进行训练。训练完毕之后,人就会从里边得到一些规则,道理。然后,人...原创 2019-04-14 16:04:34 · 579 阅读 · 0 评论 -
线性回归算法思路总结(详细)
机器学习的分类(下边都是监督学习)监督学习分类回归无监督学习聚类降维半监督学习强化学习机器学习(监督)的基本概念机器学习,就是让电脑模仿人进行学习人在做任何事,也需要学习,比如说考试,需要看文档或者查资料,再或者有人传授。那么这个人在文档中、资料中、听课中,得到一个一个个的问题,以及这些问题所对应的正确答案,对自己进行训练。训练完毕之后,人就会从里边得到一些...原创 2019-03-27 20:06:02 · 9281 阅读 · 1 评论 -
【机器学习】神经网络介绍【转】
【深度学习】神经网络介绍 1 神经元 2 激活函数 3 感知机与多层网络 4 误差反向传播 参考:周志华《机器学习》 ...转载 2019-03-27 16:58:57 · 720 阅读 · 0 评论 -
机器学习-样本不均衡现象
转载自:http://blog.csdn.net/lujiandong1/article/details/52658675这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最...转载 2019-03-27 14:33:24 · 1635 阅读 · 0 评论 -
机器学习十大经典算法入门【转】
一,SVM(Support Vector Machine)支持向量机 a. SVM算法是介于简单算法和神经网络之间的最好的算法。 b. 只通过几个支持向量就确定了超平面,说明它不在乎细枝末节,所以不容易过拟合,但不能确保一定不会过拟合。可以处理复杂的非线性问题。 c. 高斯核函数...转载 2019-03-24 16:27:51 · 295 阅读 · 0 评论 -
机器学习,深度学习等概念区别【转】
1、人工智能->机器学习->深度学习 注:->包含关系2、机器学习领域: 模式识别=机器学习 数据挖掘=机器学习+数据库 统计学习=机器学习 计算机视觉=图像处理+机器学习...转载 2019-03-24 16:25:13 · 368 阅读 · 0 评论 -
机器学习-算法决策树学习笔记(详解)
决策树的概念决策树是一种非参数的监督学习方法,既可以用于分类,也可以用于回归。决策树的目标是创建一个模型,从数据特征中进行学习,进而推断出简单决策规则,用来预测目标变量的值决策树的决策过程就是从根节点开始,测试待分类项中对应的特征属性,并按照其值选择输出分支,直到叶子节点,将叶子节点的存放的类别作为决策结果。# 个人理解就是按照一定的决策树构建规则来构建一个决策树,将数据集中的各个属性...原创 2019-03-26 15:24:48 · 836 阅读 · 1 评论 -
机器学习面试常用算法知识点梳理总结(转)
原文地址:http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其...转载 2019-03-21 10:02:32 · 303 阅读 · 0 评论 -
机器学习入门好文,强烈推荐(转载)
转自 飞鸟各投林史上最强----机器学习经典总结---入门必读----心血总结-----回味无穷让我们从机器学习谈起导读:在本篇文章中,将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 ...转载 2019-03-21 09:56:33 · 474 阅读 · 0 评论 -
十种常用机器学习算法入门
弱人工智能近几年取得了重大突破,悄然间,已经成为每个人生活中必不可少的一部分。以我们的智能手机为例,看看到底温藏着多少人工智能的神奇魔术。下图是一部典型的智能手机上安装的一些常见应用程序,可能很多人都猜不到,人工智能技术已经是手机上很多应用程序的核心驱动力。图1 智能手机上的相关应用传统的机器学习算法包括决策树、聚类、贝叶斯分类、支...转载 2019-03-21 09:50:30 · 174 阅读 · 0 评论 -
python连接hive总结
开篇```工作中需要,在本地使用python通过远程连接hive,去读取hive的一些表中大量的数据。进行一些数据预处理,然后测试模型的精准度。``````python连接hive,很艰难,很麻烦,在初期去安装一些相关类库的时候,就会出现大量的问题。后期连接成功之后,也出现了连接不稳定的情况,很多时候,在读取文件的时候不能够连续读取。而且,读取效率极慢,慢出了一个天际。````...原创 2019-06-05 18:21:08 · 36104 阅读 · 10 评论