YYDU_666
码龄7年
关注
提问 私信
  • 博客:108,809
    108,809
    总访问量
  • 15
    原创
  • 769,548
    排名
  • 27
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2017-11-24
博客简介:

YYDU_666的博客

查看详细资料
个人成就
  • 获得26次点赞
  • 内容获得13次评论
  • 获得116次收藏
创作历程
  • 1篇
    2022年
  • 3篇
    2019年
  • 37篇
    2018年
  • 4篇
    2017年
成就勋章
TA的专栏
  • CDH安装
  • 集群搭建计算--硬盘、内存、服务器台数
    1篇
  • Java基础知识
  • 数据库
    3篇
  • hive
    4篇
  • hadoop
    5篇
  • shuffle
    1篇
  • apreduce
    5篇
  • spark
    1篇
  • 数据结构
    1篇
  • hbase
    4篇
  • sqoop
    1篇
  • greenplum
    4篇
  • Elasticsearch
    11篇
  • Linux
    1篇
  • Oracle
    1篇
  • Kudu
    1篇
兴趣领域 设置
  • 大数据
    hadoophivespark数据仓库etl
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Redis(缓存)

redis缓存机制:缓存中的数据,一定是数据库中的数据,使用缓存主要的目的就是降低用户访问物理设备的频次.如果数据库记录更新,则缓存应该同步更新.
转载
发布博客 2022.10.20 ·
272 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ElasticSearch分页查询详解-----------深度分页(from-size)和快照分页(scroll)

  Elasticsearch中数据都存储在分片中,当执行搜索时每个分片独立搜索后,数据再经过整合返回。那么,如何实现分页查询呢?       按照一般的查询流程来说,如果我想查询前10条数据:        1)客户端请求发给某个节点        2)节点转发给个个分片,查询每个分片上的前10条        3)结果返回给节点,整合数据,提取前10条        4...
原创
发布博客 2018.09.20 ·
3399 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

关于ES性能调优几件必须知道的事

零)ElasticSearch架构概述ElasticSearch是现在技术前沿的大数据引擎,常见的组合有ES+Logstash+Kibana作为一套成熟的日志系统,其中Logstash是ETL工具,Kibana是数据分析展示平台。ES让人惊艳的是他强大的搜索相关能力和灾备策略,ES开放了一些接口供开发者研发自己的插件,ES结合中文分词的插件会给ES的搜索和分析起到很大的推动作用。Elas...
转载
发布博客 2019.03.15 ·
4178 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

elasticsearch5.x集群HA原理(shards、replicas)

最近在搭建es5.2的高可用集群,在这个过程中加深了对es的原理理解,基本分为四个阶段es单机—>es集群(多台机器)—>es分片和副本集分布原理—>es高可用集群1.es单机在第一个阶段基本概念的掌握还是比较熟练的,对应着关系型数据库(mysql)来理解es:文档(document)文档(document)是ElasticSearch中的存储形式。对所有...
转载
发布博客 2019.03.12 ·
999 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

ElasticSearch怎样设置 master、data 和 client 节点

在生产环境下,如果不修改elasticsearch节点的角色信息,在高数据量,高并发的场景下集群容易出现脑裂等问题。  默认情况下,elasticsearch 集群中每个节点都有成为主节点的资格,也都存储数据,还可以提供查询服务。这些功能是由两个属性控制的。    1. node.master    2. node.data  默认情况下这两个属性的值都是true。  node.m...
原创
发布博客 2019.01.05 ·
10240 阅读 ·
3 点赞 ·
2 评论 ·
14 收藏

ElasticSearch增删该查Linux下命令大全

我们通常用用_cat API检测集群是否健康。 确保9200端口号可用:  curl 'localhost:9200/_cat/health?v'   绿色表示一切正常, 黄色表示所有的数据可用但是部分副本还没有分配,红色表示部分数据因为某些原因不可用.   2.通过如下语句,我们可以获取集群的节点列表:  curl 'localhost:9200/_cat/nodes?v...
原创
发布博客 2018.12.26 ·
1993 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

ElasticSearch增删该查Linux下命令大全

我们通常用用_cat API检测集群是否健康。 确保9200端口号可用:  curl 'localhost:9200/_cat/health?v'   绿色表示一切正常, 黄色表示所有的数据可用但是部分副本还没有分配,红色表示部分数据因为某些原因不可用.   2.通过如下语句,我们可以获取集群的节点列表:  curl 'localhost:9200/_cat/nodes?v...
原创
发布博客 2018.12.26 ·
1993 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Elasticsearch —— bulk批量导入数据

在使用Elasticsearch的时候,一定会遇到这种场景——希望批量的导入数据,而不是一条一条的手动导入。那么此时,就一定会需要bulk命令!更多内容参考我整理的Elk教程bulk批量导入批量导入可以合并多个操作,比如index,delete,update,create等等。也可以帮助从一个索引导入到另一个索引。语法大致如下;action_and_meta_data
...
转载
发布博客 2018.12.03 ·
1043 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Linux下mysql彻底卸载

一、使用以下命令查看当前安装mysql情况,查找以前是否装有mysql? 1 rpm -qa|grep -i mysql 可以看到如下图的所示:显示之前安装了:     MySQL-client-5.5.25a-1.rhel5     MySQL-server-5.5.25a-1.rhel52、停止mysql服务、删除之前安装的m...
原创
发布博客 2018.11.15 ·
242 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

KUDU--秒级查询的数据仓库

## == Kudu 是什么 == Kudu是Todd Lipcon@Cloudera带头开发的存储系统,其整体应用模式和HBase比较接近,即支持行级别的随机读写,并支持批量顺序检索功能。 那既然有了HBase,为什么还需要Kudu呢,简单的说,就是嫌弃HBase在OLAP场合,SQL/MR类的批量检索场景中,性能不够好。通常这种海量数据OLAP场景,要不走预处理的路,比如像EB...
转载
发布博客 2018.11.05 ·
2020 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

ElasticSearch底层原理浅析

基本概念索引(Index)ES将数据存储于一个或多个索引中,索引是具有类似特性的文档的集合。类比传统的关系型数据库领域来说,索引相当于SQL中的一个数据库,或者一个数据存储方案(schema)。索引由其名称(必须为全小写字符)进行标识,并通过引用此名称完成文档的创建、搜索、更新及删除操作。一个ES集群中可以按需创建任意数目的索引。类型(Type)类型是索引内部的逻辑分区(categ...
原创
发布博客 2018.09.20 ·
5238 阅读 ·
2 点赞 ·
0 评论 ·
21 收藏

Elasticsearch工作原理

一、关于搜索引擎各位知道,搜索程序一般由索引链及搜索组件组成。索引链功能的实现需要按照几个独立的步骤依次完成:检索原始内容、根据原始内容来创建对应的文档、对创建的文档进行索引。搜索组件用于接收用户的查询请求并返回相应结果,一般由用户接口、构建可编程查询语句的方法、查询语句执行引擎及结果展示组件组成。著名的开源程序Lucene是为索引组件,它提供了搜索程序的核心索引和搜索模块,例...
原创
发布博客 2018.09.18 ·
292 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

windows10下安装oracle11g和PLSQL Developer

工具/原料 oracle11g安装包(64位) oracle11g客户端(32位) PLSQL Developer安装包 方法/步骤 1 在Oracle官网下载安装包,下载后,得到的文件如图所示: 2 将两个文件进行解压缩,得到目录如图所示: 3 双击setup.exe,系统将会进行自检,若提示[INS-13001]环...
原创
发布博客 2018.09.15 ·
1566 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

Elasticsearch使用REST API实现全文检索

Elasticsearch使用REST API实现全文检索Elasticsearch REST APIelasticsearch支持通过http请求响应服务,http请求默认使用9200断开,因此通过curl命令,可以发送http请求,并得到json返回内容。常用的REST API包括一下几个:检查ES集群状态curl http://localhost:9200/_cat/hea...
转载
发布博客 2018.09.12 ·
404 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

logstash-input-jdbc 同步原理及定时器

定时器: 多久执行一次SQL,默认是一分钟  # schedule =>    分 时 天 月 年  # schedule => * 22  *  *  *     表示每天22点执行一次 schedule => "前言:基于logstash-input-jdbc较其他插件的稳定性、易用性、版本和ES同步更新的特点,以下研究主要针对 logstash-input-...
原创
发布博客 2018.08.29 ·
5257 阅读 ·
1 点赞 ·
1 评论 ·
4 收藏

Win7 64位系统U盘安装Centos6.5双系统

安装前准备:  U盘、软碟通(UltraISO)、CentOS-6.5-x86_64-bin-DVD1(DVD 2只是一些软件,安装系统只要DVD1就可以) 设置安装Centos的磁盘位置:  应该单独分出一块逻辑盘来安装Centos系统,逻辑盘的意思就是常规定义上的C盘、D盘、E盘、F盘,可以用一些磁盘分区软件设置一个差不多大小的F空盘用来安装Centos系统; 将Cen...
原创
发布博客 2018.08.13 ·
341 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Linux下安装Elasticsearch5.X

下载Elasticsearch  登录官网 https://www.elastic.co/cn/downloads  选择下载elasticsearch,根据需要选择对应的安装包,这里选择5.0版本,下载完后得到 elasticsearch-5.0.0.tar.gz解压安装  将 elasticsearch-5.0.0.tar.gz 拷贝到 /opt 目录下。  在Linux中...
原创
发布博客 2018.08.10 ·
655 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

greenplum使用gpfdist与外部表高效导入数据教程

greenplum作为OLAP分析型软件,自然避免不了从外部数据库加载大量的数据,然而传统的ETL数据传输方法(select=>insert)到GP需要经过GP的单点master,效率非常低。下面介绍外部表用gpfdist快速导入数据:普通外部表和可写外部表区别:1、普通外部表只能select,可写外部表只能insert2、可写外部表没有错误表3、可写外部表可以指定分布键...
转载
发布博客 2018.07.29 ·
3658 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

文本文件导入greenplum数据库方法

COPY 命令可以快速的导入数据到 PostgreSQL 中,文件格式类似CVS,txt之类。适合批量导入数据,比自己写脚本逐条插入快很多 文件导入数据库主要分三个步骤:首先,你必须Linux系统中存在这个文件,比如/home/user/test.csv数据只有一列,如下:12345678然后,在数据库建立对应的表,如create talbe...
转载
发布博客 2018.07.28 ·
2804 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Greenplum创建表--分布键

Greenplum是分布式系统,创建表时需要指定分布键(创建表需要CREATEDBA权限),目的在于将数据平均分布到各个segment。选择分布键非常重要,选择错了会导致数据不唯一,更严重的是会造成SQL性能急剧下降。 Greenplum有两种分布策略:1、hash分布。Greenplum默认使用hash分布策略。该策略可选一个或者多个列作为分布键(distribution key...
转载
发布博客 2018.07.28 ·
7947 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏
加载更多