自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (2)
  • 收藏
  • 关注

转载 Spark:大数据的“电光石火”

原文地址:http://www.csdn.net/article/2013-07-08/2816149Spark已正式申请加入Apache孵化器,从灵机一闪的实验室“电火花”成长为大数据技术平台中异军突起的新锐。本文主要讲述Spark的设计思想。Spark如其名,展现了大数据不常见的“电光石火”。具体特点概括为“轻、快、灵和巧”。轻:Spark 0.6核心代码有2万行,

2015-12-24 15:20:28 769

原创 聚类分析----学习笔记

聚类分析----学习笔记

2015-12-24 14:35:41 1228

原创 Single-Pass聚类算法 及其在新事件探测中的应用

Single-pass算法的思想是:按一定顺序依次读取数据,每次读取的新数据都和已经读取并聚类的数据进行比较,如果按照一定规则找到相应的近似组别,则将这个新数据归入这个类中,如果没有,则将这个新数据视为一个新类。就这样反复执行,直到所有的数据都读完。整个过程只对数据进行一次读取(single)。 Single-Pass聚类算法在新事件探测中的应用将要检测的文档,

2015-12-18 14:52:04 14369 2

转载 TF-IDF及其算法

原文地址:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html概念     TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其

2015-12-15 08:50:30 1074

转载 最短路径—Dijkstra算法和Floyd算法

原文地址:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/31/2615833.htmlDijkstra算法1.定义概览Dijkstra(迪杰斯特拉)算法是典型的单源最短路径算法,用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法是很有代表

2015-12-12 19:54:23 727

翻译 深度学习:对实际问题解决者的简要指导

深度学习:对实际问题解决者的简要指导 注:本文在翻译时,并未逐字逐句进行翻译,有些地方只是将其主旨翻译出来,需要查看详细的文章,其原文链接为:http://www.infoworld.com/article/3003315/big-data/deep-learning-a-brief-guide-for-practical-problem-solvers.html Nov 10,201

2015-12-06 20:21:24 1212

转载 Pig Hive对比

原文地址:http://blog.csdn.net/rzhzhz/article/details/7557607Pig Latin:数据流编程语言一个Pig Latin程序是相对于输入的一步步操作。其中每一步都是对数据的一个简单的变换。用Pig Latin编程更像在RDBMS中“查询规划器”(query planner)这一层对数据进行操作,查询规划器决定了如何

2015-12-04 15:05:36 423

原创 利用python中的pandas,sklearn进行数据挖掘 basic_of_datamining

basic_of_datamining 利用python中的pandas,sklean进行数据挖掘github 源码地址:https://github.com/zhangxinxing/basic_of_dataminingpandas用来对数据集进行处理 sklean中提供了一些机器学习方法的实现要利用这两个库,首先

2015-12-03 21:57:52 3074

测试数据集

用于测试的数据集合,配套https://github.com/zhangxinxing/basic_of_datamining

2015-11-15

SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

SQLserver 数据挖掘数据样例 DMAddins_SampleData.xlsx

2015-06-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除