数据挖掘
木头左
这个作者很懒,什么都没留下…
展开
-
启动hadoop步骤和遇到的坑
格式化HDFS分布式文件系统hadoop namenode –format启动Hadoopstart-all.sh停止Hadoopstop-all.shjps命令可以看到Hadoop的所有守护进程用hdfs dfsadmin -report 命令来检查,能看到DataNode状态才是正常可以通过Hadoop NameNode和JobTracker的Web接口来查看集群是否启动成功,其访问地址如下http://192.168.96.128:80...原创 2020-08-14 18:45:31 · 1552 阅读 · 0 评论 -
Hadoop安装步骤和遇到的坑
Hadoop安装安装并配置hadoop-2.6.4(在master中)(1)将hadoop-2.6.4.tar.gz安装包复制到hadoop文件目录下(与windows环境下类似)。(2)解压hadoop-2.6.4.tar.gzcdcd hadooptar -zxvf hadoop-2.6.4.tar.gz添加环境变量: vim /etc/profile 在最后添加# set hadoop environmentexport HADOOP_HOME...原创 2020-08-14 18:40:50 · 381 阅读 · 0 评论 -
Hive搭建
前提条件:下载:https://mirrors.cnnic.cn/apache/hive/安装了hadoop集群,1.解压缩hive的软件包,使用命令:tar -zxvf hive-3.1.0-bin.tar.gz2.进入hive的配置目录. 编辑/usr/local/data/hive-3.1.0/conf/hive-site.xml 添加配置文件:<?xml version="1.0" encoding="UTF-8" standalone="no"?>...转载 2020-08-14 18:31:24 · 162 阅读 · 0 评论 -
数据挖掘入门
1、 数据挖掘论文怎么找数据 UCI,数据堂2、 高手推荐学习数据挖掘的方法以及详细的学习过程个人建议如下:数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机转载 2016-06-18 17:02:53 · 679 阅读 · 0 评论 -
Elasticsearch-基础介绍及索引原理分析
介绍Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作:分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。实时分析的分布式搜索引擎。可以扩展到上百台服务器,处理PB级别...转载 2018-11-21 12:00:29 · 276 阅读 · 0 评论