数据分析与机器学习
文章平均质量分 89
蜡笔小新丶不小心
这个作者很懒,什么都没留下…
展开
-
数据分析与机器学习学习笔记--常见知识总结
1.引言 最近一段心血来潮自学了数据分析与机器学习,在学习的过程中犯过许多错误以及对部分知识的错误理解,所以决定自己瞎写几篇博客总结自己的错误并且回顾学过的算法,同时希望自己的总结能帮一些同样是想要入门学习的人少走弯路,话不多说,接下来就是一些常用的数据处理方式和容易混淆的概念。2.损失函数(lost)、代价函数(cost)和目标函数(obj) 机器学习的每个算法都...原创 2018-06-04 16:54:31 · 1063 阅读 · 2 评论 -
数据分析与机器学习学习笔记--循环神经网络(通俗理解)
1.引言 接着上文的CNN来说,CNN通常用于计算机视觉领域那么这个循环神经网络(RNN)是什么的干活?相比于计算机视觉RNN通常作用于语言处理,目前最为常见的自然语言处理就是通过RNN的‘同胞’实现的。或许你会疑问既然CNN已经如此强大了为什么对语言的处理不延续使用CNN模型呢?由于语言的数据量十分庞大使用CNN进行训练需要的参数存在几何倍增加,同时我们没说一句话都是存在一定的...原创 2018-08-13 17:39:53 · 829 阅读 · 0 评论 -
数据分析与机器学习学习笔记--人工神经网络
1.引言 铛铛铛,welcome to Neural Networks,经过这么长时间的“折磨”终于进入到神经网络模块。首先大致介绍一下何为神经网络,神经网络最初的名字叫做感知机,在当时并没有引起过多的反向,但是后来改名为神经网络后这个名称听起来就非常的高大上了哈哈,理所当然的引起了人们的注意,所以说明什么?一个好名字是多么重要(纯属瞎掰)。神经网络最早出现与1943年是一位心理...原创 2018-07-30 21:13:47 · 610 阅读 · 0 评论 -
P. F. Felzenszwalb and D. P. Huttenlocher. Efficient Graph- Based Image Segmentation. IJCV, 59:167–1
转 Efficient Graph-Based Image Segmentation解读 2016年01月24日 23:20:13 阅读数:4183 ...转载 2018-07-23 22:10:35 · 3138 阅读 · 0 评论 -
数据分析与机器学习学习笔记--聚类算法
1.引言聚类算法分属与机器学习中的无监督学习类型,由于无监督学习大多是根据距离进行分类所以其准确性远不及有监督学习,但是聚类算法用于数据预处理还是有很大作用的。例如我们拿到一个数据集后通过聚类算法生成3个类别,在此基础上将第一次分类产生的标签用于接下来进一步的有监督学习(典型的Stacking模型思想),使用这个思路得到的模型效果往往要好一些。此外,他还能进行数据摘要、数据降维与数据...原创 2018-07-23 17:16:37 · 518 阅读 · 0 评论 -
数据分析与机器学习学习笔记--贝叶斯算法
1.引言 贝叶斯算法源自于概率论中的贝叶斯公式,首先我们了解一下贝叶斯公式的作用,概率论中分为正向概率与逆向概率 正向概率:假设袋子里面有N个白球,M个黑球,求解你伸手进去摸一把,摸出黑球的概率是多大 逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,求解此袋子里面的黑白球的比例 对于上面正...原创 2018-07-05 10:52:59 · 320 阅读 · 0 评论 -
数据分析与机器学习学习笔记--降维算法
1.引言 我们在训练模型时遇到的数据集千奇百怪,各式各样,有的数据集维度过高此时计算起来十分复杂效率不高,因此就顺势提出了数据降维概念,数据降维最直观的感觉是维度降低方便数据可视化展示以及机器学习算法的计算,从深层次来说在于提取重要信息以及刨除“无关信息”例如之前提到的筛选特征。从整体上来说数据降维可分为有监督与无监督两类,线性映射与非线性映射两类,本篇介绍一个有监督算法线性判别...原创 2018-07-16 18:56:44 · 406 阅读 · 0 评论 -
数据分析与机器学习学习笔记--支持向量机
1.引言 大千世界各种数据类型无奇不有,假设我们手上有一份非线性数据或者高维数据并且想要进行一个分类预测,然而遇到此类型的数据时我们之前介绍的逻辑回归算法的表现并不好,从左图上可以明显看出我们想要将数据分成内部点集和外部圆圈两类,但是使用逻辑回归的效果如图上红色的线可以明显看出并不能有效的分类;由此提出了支持向量机,支持向量机(Support Vector Machine)简称SV...原创 2018-07-09 09:02:43 · 467 阅读 · 1 评论 -
数据分析与机器学习学习笔记--集成算法
1.引言 之前的博客提出了许多的算法,但是在某些特定情况下各种算法可达到的精度不满足我们的要求,为了解决这一情况该怎么办呢?俗话说的好“三个臭皮匠赛过诸葛亮”,于是就有人提出这一假设,一个算法不行为什么不用多个算法呢,因此集成算法的就应运而生。集成算法主要分为Bagging模型、Boosting模型和Stacking模型三类,对于前两种算法目前应用较多,第三种算法使用的不是太多,但...原创 2018-06-29 20:51:49 · 335 阅读 · 0 评论 -
数据分析与机器学习学习笔记--决策树
1.引言 决策树是机器学习中十分强大的一个分类算法,决策树在进行分类时表现效果非常优秀,但是由于模型的特殊性不容易对其进行移植,在决策树中所有的数据最终都会落到叶子节点,非叶子节点仅仅用作判定条件存在,在大量比赛中获得较好名次的分类算法都是由此算法作为基础进行集成算法得到,集成算法将在下一篇中进行介绍,为了了解决策树算法我们还要学习一些其他知识,如熵接下来我将会对其进行简单介绍。...原创 2018-06-17 22:05:18 · 315 阅读 · 0 评论 -
数据分析与机器学习学习笔记--线性回归与逻辑回归
1.引言 线性回归与逻辑回归,作为初识机器学习的两个经典算法拥有大量的实践经验,这两个算法的名称虽然都包含回归,但其内容并非如此,其中线性回归的作用是对连续性数据进行回归分析,而逻辑回归确实一个作用于离散型数据的经典分类算法。正如我上篇文章所说的没有最好的算法只有最合适的算法,在kaggle竞赛排行榜中这两个算法总体表现是最好的,虽然没有夺得过最好的排名,但是总体精度确非常优...原创 2018-06-11 17:27:29 · 677 阅读 · 0 评论 -
数据分析与机器学习学习笔记--卷积神经网络(通俗理解)
1.引言 卷积神经网络(CNN)广泛应用于图像识别和目标检测,是目前计算机视觉领域的中坚力量。上世纪60年代,Hubel等人通过对猫视觉皮层细胞的研究,提出了感受野这个概念,到80年代,Fukushima在感受野概念的基础之上提出了神经认知机的概念,可以看作是卷积神经网络的第一个实现网络,在早期图像识别类的问题大多采用支持向量机解决,但是由于在2012年的Imagenet比赛中C...原创 2018-08-13 17:39:36 · 747 阅读 · 0 评论