大数据挖掘
feng_zhiyu
这个作者很懒,什么都没留下…
展开
-
【学习笔记】大数据搜索与挖掘
第一章 绪论“我们虽然淹没在信息的海洋中,但是却渴求所需的知识。” 美国作家,奈斯比特《大趋势》。为什么会出现这种情况呢?主要原因之一是缺乏有效的大数据搜索、挖掘与知识获取手段。何谓大数据?研究机构Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策了、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;大数据通常用来形容大量的额非结构化和半结构化数据。大数据的主要...原创 2018-07-01 22:24:12 · 1144 阅读 · 0 评论 -
阿里云服务器centos7.2下基于hadoop2.7安装Hive 2.3.0【成功版】
前言之前参照一个易百教程安装过,里面装的另外一个数据库(derby),不是很懂,配置没弄好,一堆报错,放弃了。【有兴趣的可以看看,大佬无视~】阿里云服务器centos7.2下基于hadoop2.7安装Hive 2.3.0【部分待解决】网上的“博客教程”很多,走了一些弯路,这里记录下自己的安装成功过程。希望有所帮助。假设现在你已经安装好了hadoop,没安装的可以参考阿里云服务器cent...原创 2018-07-16 17:48:53 · 834 阅读 · 2 评论 -
阿里云服务器centos7.2下搭建hadoop伪分布式环境
https://www.cnblogs.com/ztca/p/8679056.html原创 2018-07-12 16:58:34 · 3447 阅读 · 5 评论 -
阿里云服务器centos7.2下安装Spark 2.2.1
安装Spark时版本选择与hadoop版本有关。点击打开链接 进入后,选择一个能用的镜像。 一般情况下,这两个镜像都能用,http://www-eu.apache.org/dist/spark/spark-2.2.1/spark-2.2.1-bin-hadoop2.7.tgz http://www-us.apache.org/dist/spark/spark-2.2.1/...原创 2018-07-14 10:44:20 · 750 阅读 · 0 评论 -
数据挖掘十大算法之Apriori详解
原文见:原文链接 在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献【1】。本博客已经介绍过的位...转载 2018-07-15 11:05:55 · 2230 阅读 · 0 评论 -
【学习记录】数据挖掘---Apriori算法
前言: “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人们发现了一个特别有趣的现象,尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫...原创 2018-07-15 11:22:35 · 1014 阅读 · 0 评论