大数据
ErnestW
这个作者很懒,什么都没留下…
展开
-
WIN10系统安装虚拟机以及CentOS7
WIN10系统安装虚拟机(VM) 下载虚拟机文件 此处需要下载vm11以上的版本,当前使用的是14版本。 官网地址:https://www.vmware.com/products/workstation-pro/workstation-pro-evaluation.html 注意:不要不要安装低版本的虚拟机 本人刚开始安装了VM9,可以安装成功。并且安装使用没有问题,但是无法使用桥接的方式连接网络...转载 2019-03-31 15:25:27 · 4209 阅读 · 1 评论 -
Elasticsearch技术解析与实战---安装配置
1、安装java Elasticsearch需要Java 7或者更高版本。 java -version 验证java版本 2、安装Elasticsearch 下载路径:https://www.elastic.co/cn/downloads/past-releases/elasticsearch-2-3-0 3、配置 1、elasticsearch.yml配置说明 在E:\安装包\elasticse...转载 2019-04-09 22:28:17 · 172 阅读 · 0 评论 -
Elasticsearch技术解析与实战---基础知识Elasticsearch术语就概念
1、索引词(term) 能够被索引的精确值。 2、文本(text) 通常文本会被分析成一个个索引词,存在Elasticsearch的索引库中。 3、分析(analysis) 分析是将文本转换为索引词的过程,分析的结果依赖于分词器。 4、集群(cluster) 集群由一个或多个节点组成,对外提供服务,对外提供索引和搜索功能。在所有节点中,一个集群有一个唯一的名称默认为Elasticsearch。 5...转载 2019-04-09 22:28:34 · 273 阅读 · 0 评论 -
Elasticsearch技术解析与实战----Lucene简介
1、Lucene倒排索引 倒排索引来源与根据属性的值来查找记录。这种索引表的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。 过程: 1、取得关键字 比如:[tom][live][shanghai]。 其中:in,once,too等词没有实际意义,的、是等词也没有具体含义,可以过滤掉。 2、建立倒排索引 文章号对应文章...转载 2019-04-09 22:28:47 · 205 阅读 · 0 评论 -
hadoop从零开始教程第二篇(hadoop shell命令操作)
去原创 2019-04-14 21:45:13 · 594 阅读 · 1 评论 -
Hadoop从零开始教程第一篇(在linux上安装hadoop集群centos7+hadopp3.2)
Hadoop简介 Hadoop是Apache旗下的一套开源分布式计算平台。 应用范围:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。 核心组件: HDFS(分布式文件系统)高容错性、高伸缩性等允许用户将Hadoop部署在低廉的硬件上 YARN(运算资源调度系统) MAPREDUCE(分布式运算编程框架)允许用户在不了解分布式系统细节情况下开发并行应用程序。 准备Linux...原创 2019-04-14 21:48:14 · 652 阅读 · 0 评论 -
hadoop从零开始教程第三篇(HDFS原理)
1、概述 1.HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode) 2.NameNode负责管理整个文件系统的元数据 3.DataNode 负责管理用户的文件数据块 4.文件会按照固定的大小(blocksize)切成若干块后分布式存储在若干台datanode上 5.每一个文件块可以有多个副本,并存放在不同的datanode上 6.Datanode...原创 2019-04-27 19:18:39 · 194 阅读 · 0 评论