机器学习与数据挖掘
_Bob908
这个作者很懒,什么都没留下…
展开
-
面试之机器学习算法思想简单梳理
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺转载 2014-08-19 17:33:17 · 1164 阅读 · 0 评论 -
数据挖掘中的分类算法比较
随着计算能力、存储、网络的高速发展,人类积累的数据量正以指数速度增长。对于这些数据,人们迫切希望从中提取出隐藏其中的有用信息,更需要发现更深层次的规律,对决策,商务应用提供更有效的支持。为了满足这种需求,数据挖掘技术的得到了长足的发展,而分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。本文主要侧重数据挖掘中分类算法的效果的对比,通过简单的实验(采用开源的数据挖掘工具 -Weka)来验证转载 2014-07-22 16:31:02 · 4974 阅读 · 0 评论 -
机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)
前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在verycd可下载,可惜没有翻译。不过还是可以看。另外一个是prml-pattern recognition and machine learning, Bishop的一部反响不错转载 2014-07-24 22:22:37 · 830 阅读 · 0 评论 -
GPU上大规模稀疏矩阵特征值计算高效算法之三——SLEPc测试
Slepc计算矩阵特征值时间测试注:(1)GPU集群介绍:该集群有一个登录节点(ustcgpu)和100个计算节点(node1~node100)。各计算节点配置2颗4核的IntelE5520 CPU,16GB内存,通过20GbsInfiniBand互联。(2)测试采用Krylov-Schur算法计算速度这里采用Slepc计算稀疏度约为1%矩阵的一半特原创 2014-08-19 11:23:08 · 3266 阅读 · 0 评论 -
数据挖掘分类算法的优缺点总结
最近在学习分类算法,顺便整理了各种分类算法的优缺点。一.决策树一种启发式算法,核心是在决策树各个节点上应用信息增益等准则来选取特征,进而递归地构造决策树。优点:1. 计算复杂度不高,易于理解和解释,可以理解决策树所表达的意义;2. 数据预处理阶段比较简单,且可以处理缺失数据;3. 能够同时处理数据型和分类型属性,且可对有许多属性的数据集构造决策树原创 2014-07-23 22:17:15 · 6546 阅读 · 0 评论 -
GPU上大规模稀疏矩阵特征值计算高效算法之二——稀疏矩阵
稀疏矩阵存储方式1)协调存储格式 COO(coordinate format)COO 格式是一种简单的存储方案,采用三个数组存储行标识,列标识和非0元素的值。COO是一种通用的存储格式,缺点是存储的效率不高。2)3)原创 2014-08-19 10:46:54 · 4720 阅读 · 0 评论 -
分类算法之三——SVM分类器
一般对于高维数据的分类问题,比如10000维的原创 2014-08-20 08:04:52 · 1398 阅读 · 0 评论 -
分类算法之一——数据预处理
现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提前数据挖掘的质量产生了数据预处理技术。 数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。这些数据处理技术在数据挖掘之前使用,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。 一、数据清理 首先是处理空缺值,如:要分析某市场的销售和顾客数据,但顾客的income项转载 2014-08-19 15:08:02 · 3306 阅读 · 0 评论 -
机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距转载 2014-07-27 21:40:34 · 608 阅读 · 0 评论 -
GPU上大规模稀疏矩阵特征值计算高效算法之一——GPU介绍
1.GPU基本知识2.稀疏矩阵存储方式3.ju z原创 2014-08-19 09:46:28 · 6837 阅读 · 0 评论