大数据 数据挖掘
文章平均质量分 76
程序员杰
半路出家的程序猿,吼吼
展开
-
MapReduce技术的初步了解与学习
MapReduce技术的初步了解与学习 --包含Google MapReduce中文版今天咱们学习下MapReduce模型。由于是本人是初次接触,不是很了解。所以,有任何问题,还望各位不吝批评指正。本文中,我会先用最最通俗的语言阐述什么是MapReduce,然后再摘自Google MapReduce中文版上的一些内容,以期对这个模型有个初步的了解与认识。ok,闲不多说,下面转载 2013-12-13 21:04:52 · 709 阅读 · 0 评论 -
遗传算法
转自:http://www.cnblogs.com/heaad/ 遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化论知识 作为遗传算法生物背景的介绍,下面内容了解即可: 种群(Popula转载 2013-11-27 17:59:29 · 749 阅读 · 0 评论 -
可视分析 、智能交通、时空信息分析、生物信息数据简介
可视分析 Visual AnalyticsVisual analytics is the science of analytical reasoning facilitated by interactive visual interfaces.---- 摘自 Illuminating the Path - The Research and Developme原创 2013-11-10 11:04:32 · 2252 阅读 · 0 评论 -
数据挖掘,机器学习等方面书籍推荐
这里的书涉及到信息检索,自然语言处理,机器学习,模式识别,数据挖掘的方方面面,每一本书都是值得读者深入的阅读,研究和讨论的。因此,我只能就我个人的理解对几本相对熟悉的或者读者的评价很高的书做一些简单的介绍,一来抛砖引玉,希望大牛来多给些指正,二来也为他人的学习提供一些经验。这里是river同学的介绍,有什么问题可以直接与他沟通联系,他的信箱是hechuanbup转载 2013-11-09 18:59:42 · 948 阅读 · 0 评论 -
从大数据中挖掘什么?
概要:大数据挖掘中最重要的是决定挖掘什么样的知识,这是在数据的收集、处理、挖掘的整个过程中都需要认真考虑的问题。本文首先提出大数据挖掘的几项策略,即尽量设想挖掘的场景,尽量多方面收集数据,尽量将数据整合,悉心观察数据特征。之后结合自己在互联网搜索中的大数据挖掘工作经验,分享对这些策略的体会。最后介绍一个互联网搜索中大规模日志数据挖掘的工作,展示大数据挖掘的威力,呈现大数据挖掘的挑战。1. “挖转载 2013-11-07 13:35:39 · 973 阅读 · 0 评论 -
经典的机器学习方面源代码库
今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源软件)htt转载 2013-11-16 21:37:51 · 868 阅读 · 0 评论 -
Shark:强大的开源C++机器学习库
申明:本文非笔者原创,原文转载自:http://sigvc.org/bbs/thread-872-1-1.htmlShark 是一个快速、模块化、功能丰富的开源 C++ 机器学习库,提供了各种机器学习相关技术,比如线性/非线性优化、基于内核学习算法、神经网络等。Shark 已经应用于多个现实项目中。 机器学习(Machine Learning)是一门多领域交叉学科转载 2013-11-16 21:52:06 · 903 阅读 · 0 评论 -
机器学习和计算机视觉相关的数学知识
1. 线性代数 (Linear Algebra):我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是Introduction to Linear Algebra (3rd Ed.) by Gilbert S转载 2013-11-16 21:42:56 · 1248 阅读 · 0 评论 -
python数据挖掘领域工具包
原文:http://qxde01.blog.163.com/blog/static/67335744201368101922991/Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代转载 2014-03-01 16:51:49 · 1119 阅读 · 0 评论