数据挖掘
文章平均质量分 81
驰驰的老爸
IT民工一枚,长期耕耘于JAVA, JS,LINUX一线,现在努力提高机器学习方面的技能。
展开
-
一位数据挖掘成功人士给数据挖掘在读研究生的建议
关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。 因此来说,数据挖掘融合了相当多的内容,试图全面了解所有的细节会花费很长的时间。因此我建议你的第一步是用大概三个月的时间了解数据挖掘的几个常用技术:转载 2013-04-12 08:34:57 · 994 阅读 · 0 评论 -
林奇:Autonomy的中国路
http://news.xinhuanet.com/newmedia/2005-05/23/content_2991321_1.htmhttp://www.autonomy.com.cn/content/Products/products-idol-server/index.zh.htmlAutonomy的“样板工程”Blinkx中文版测试工作正在有条不紊地进行着。转载 2013-11-19 14:38:13 · 1610 阅读 · 0 评论 -
快速构建实时抓取集群
定义:首先,我们定义一下定向抓取,定向抓取是一种特定的抓取需求,目标站点是已知的,站点的页面是已知的。本文的介绍里面,主要是侧重于如何快速构建一个实时的抓取系统,并不包含通用意义上的比如链接分析,站点发现等等特性。在本文提到的实例系统里面,主要用到linux+mysql+redis+django+scrapy+webkit,其中scrapy+webkit作为抓取端,re转载 2014-01-26 19:38:40 · 962 阅读 · 0 评论 -
使用Weka进行数据挖掘
1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而weka,便是数据挖掘工具中的佼佼者。Weka的全名是怀卡托智能分析环境(Waikato转载 2014-02-06 22:24:38 · 2880 阅读 · 0 评论