自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 过来人介绍怎样学习数据挖掘

<br />chanet:<br />       数据挖掘(DM: Data Mining)的思想最初来源于统计学,属于数据分析,而不是计算机,不过现在分两块: 理论型(统计学),实践型(计算机); 而现在两个专业都有数据挖掘专业的研究生,都是从不同的方面入手. 计机的学生啃统计学原理,时序/多元分析等,概计之类的数据理统计知识; 统计学的兄弟啃计算机的数据库原理等...互相学习...<br /><br />      如果你从计算机方面入手,那可以看一些数据挖掘的书,而大部分以数据仓库(Data War

2011-03-25 20:58:00 3422 2

转载 利用Python抓取和解析网页(二)

WebjxCom提示: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。<br />  对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,

2011-03-22 23:14:00 1522

转载 利用Python抓取和解析网页(一)

WebjxCom提示: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档<br /> <br />  上述代码的执行结果如下所示:<br />  用Google搜索python时地址栏中URL的解析结果  ('http', 'www.google.com', '/search', '',<br /><br />'hl=en&q=p

2011-03-22 23:09:00 1467

原创 利用Python抓取和解析网页(一)

<br />对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python模块来迅速解析在HTML文件中的数据,从而处理特定的内容,如链接、图像和Cookie等。最后,我们会

2011-03-22 21:16:00 1263

转载 在你的Java代码中使用Weka

1、引用 利用WEKA编写数据挖掘算法2、引用 Weka学习一(分类器算法)3、引用 Weka学习二(聚类算法)4、引用 Weka学习三(ensemble算法)5、引用 Weka学习四(属性选择)6、引用 Weka学习五(ROC简介)

2011-03-13 20:31:00 4600

转载 用WEKA进行数据挖掘,第3部分:最近邻和服务器端库

<br />简介<br />在这个 “用 WEKA 进行数据挖掘” 系列之前的两篇文章中,我介绍了数据挖掘的概念。如果您还未曾阅读过 用 WEKA 进行数据挖掘,第 1 部分:简介和回归 和 用 WEKA 进行数据挖掘,第 2 部分:分类和群集,那么请先阅读这两个部分,因为二者涵盖了一些在继续之前必须了解的关键概念。而且更重要的是,在这两个部分中我谈及了数据挖掘中常用的三种技术,它们可以将难以理解的无用数据转变为有意义的规则和趋势。第一种技术是回归,用来基于其他的示例数据预测一个数值输出(比如房屋价值)。第

2011-03-12 12:40:00 1364

转载 用WEKA进行数据挖掘,第2部分:分类和群集

<br />简介<br />在 用 WEKA 进行数据挖掘,第 1 部分:简介和回归,我介绍了数据挖掘的概念以及免费的开源软件 Waikato Environment for Knowledge Analysis(WEKA),利用它可以挖掘数据来获得趋势和模式。我还谈到了第一种数据挖掘的方法 — 回归 — 使用它可以根据一组给定的输入值预测数字值。这种分析方法非常容易进行,而且也是功能最不强大的一种数据挖掘方法,但是通过它,读者对 WEKA 有了很好的了解,并且它还提供了一个很好的例子,展示了原始数据是如何

2011-03-12 12:32:00 1957

转载 用WEKA进行数据挖掘,第1部分:简介和回归

<br />简介<br />什么是 数据挖掘?您会不时地问自己这个问题,因为这个主题越来越得到技术界的关注。您可能听说过像 Google 和 Yahoo! 这样的公司都在生成有关其所有用户的数十亿的数据点,您不禁疑惑,“它们要所有这些信息干什么?”您可能还会惊奇地发现 Walmart 是最为先进的进行数据挖掘并将结果应用于业务的公司之一。现在世界上几乎所有的公司都在使用数据挖掘,并且目前尚未使用数据挖掘的公司在不久的将来就会发现自己处于极大的劣势。<br />那么,您如何能让您和您的公司跟上数据挖掘的大潮呢

2011-03-12 12:27:00 1612

原创 Javascript实现的半自动注册小程序

<br />var ie = new ActiveXObject("InternetExplorer.Application"); ie.visible = true; ie.navigate("https://passport.baidu.com/?reg&tpl=mn"); //访问百度用户注册页面while(ie.busy){WScript.sleep(1000);} var document = ie.document; var form = document.

2011-03-11 19:45:00 703

转载 WEKA入门教程

目录<br />1. 简介 顶楼<br />2. 数据格式 顶楼<br />3.数据准备 1楼<br />4. 关联规则(购物篮分析) 1楼<br />5. 分类与回归 2楼<br />6. 聚类分析 2楼<br /><br />Weka入门教程,来自http://forum.wekacn.org/viewtopic.php?f=2&t=9。转载请注明出处。<br /><br />1. 简介<br /><br />WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowl

2011-03-11 12:01:00 971

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除