数据挖掘
文章平均质量分 68
havedream_one
这个作者很懒,什么都没留下…
展开
-
weka链接数据库
转载自:http://blog.csdn.net/popozhu/article/details/5650246数据仓库,数据分析,不涉及商业方面的高层决策之用,故本篇文章只适合初学数据仓库,为了完成老师作业,且想用weka做简单数据挖掘之用的童鞋。 weka版本是3.6.2,数据库库是SQL Server 2005,没办法,老师提供的几万条数据保存在excel表中,如果从excel转转载 2014-06-25 13:12:26 · 1474 阅读 · 0 评论 -
bp神经网络及matlab实现
本文主要内容包括: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 。第0节、引例 本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wikipedia.org/wiki/Iris_flower_data_set 找到。这里转载 2015-04-20 10:32:30 · 1718 阅读 · 0 评论 -
PageRank算法简介及Map-Reduce实现
PageRank对网页排名的算法,曾是Google发家致富的法宝。以前虽然有实验过,但理解还是不透彻,这几天又看了一下,这里总结一下PageRank算法的基本原理。一、什么是pagerank PageRank的Page可是认为是网页,表示网页排名,也可以认为是Larry Page(google 产品经理),因为他是这个算法的发明者之一,还是google CEO(^_^)。Page转载 2015-04-20 10:19:03 · 1128 阅读 · 0 评论 -
K-means算法及文本聚类实践
K-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-means算法需要事先指定簇的个数k,算法开始随机选择k个记录点作为中心点,然后遍历整个数据集的各条记录,将每条记录归到离它最近的中心点所在的簇中,之后以各个簇的记录的均值中心点取代之前的中心点,然后不转载 2015-04-20 10:08:55 · 16919 阅读 · 10 评论 -
基于BP神经网络的数据分类
基于BP神经网络的数据分类 BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,转载 2015-04-20 10:55:00 · 7733 阅读 · 5 评论 -
PageRank实践-博客园用户PageRank排名
博客园用户由关注和粉丝的关系,这与网页的链接关系很类似,于是我就爬了博客园的粉丝与关注用户,然后计算了一下用户的PageRank排名,注意本排名仅仅是个人娱乐,不代表任何利益,而且可能计算有误,望大家不要较真。 关于PageRank的原理和计算方法参看上一篇文章,这篇文章主要介绍一下博客园用户PageRank的结果. 目前博客园用户超过了17万,我以自己为启点,不断的爬取用户的转载 2015-04-20 10:13:30 · 1715 阅读 · 0 评论 -
BP神经网络算法与实践
神经网络曾经很火,有过一段低迷期,现在因为深度学习的原因继续火起来了。神经网络有很多种:前向传输网络、反向传输网络、递归神经网络、卷积神经网络等。本文介绍基本的反向传输神经网络(Backpropagation 简称BP),主要讲述算法的基本流程和自己在训练BP神经网络的一些经验。BP神经网络的结构 神经网络就是模拟人的大脑的神经单元的工作方式,但进行了很大的简化,神经网络由很多神经网转载 2015-04-20 10:00:32 · 2074 阅读 · 0 评论 -
BP神经网络模型与学习算法
一,什么是BP"BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和转载 2015-04-13 16:14:41 · 1598 阅读 · 0 评论 -
云计算,大数据,数据库,数据仓库之间是什么关系
有网友问云计算,大数据,数据库,数据仓库之间是什么关系,在这里我就我的理解简单解释一下:首先简单的看一下云计算与大数据的概念.1)云计算:云计算本质上是一种计算资源集中分布和充分共享的效用计算模式,其中集中是为了计算资源的集约化管理,分布是便于扩展计算能力.集中分布式是针对云服务提供商的,充分共享是针对用户,在云计算中,虽然对于每个云用户来说都拥有一台超级计算机,但本质上,这些用户转载 2014-07-05 15:43:02 · 9217 阅读 · 0 评论 -
深度解读Hadoop与数据仓库概念
那些想要弄清楚“大数据”概念的组织需要做出一个选择,是要采用传统的数据仓库概念和现有的数据仓库架构,还是不熟越来越流行的开源Hadoop分布式处理平台,或者使用这二者的结合。 那些想要从简单的BI报表转向深度数据挖掘与预测分析的企业,第三种选项看上去是最靠谱的。最近采访了Forrester机构的高级数据管理分析师James Kobielus,他向我们分析了企业如何从快速变化的海量数据中获转载 2014-07-05 15:45:20 · 1960 阅读 · 0 评论 -
数据挖掘之KNN分类
分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最近的实例投票决定新实例的类标。KNN是一种基于实例的学习算法,它不同于贝叶斯、决策树等算法,KNN不需要训练,当有新的实例出现时,直接在训练数据集中找k个最近的实例,把这个新的实例转载 2015-04-20 10:01:56 · 1609 阅读 · 0 评论