大数据集群清理缓存

最新推荐文章于 2024-05-15 15:02:34 发布

象在舞

最新推荐文章于 2024-05-15 15:02:34 发布

阅读量1.3k

点赞数 4

分类专栏： Linux 大数据文章标签： Linux cache 清理缓存

本文链接：https://blog.csdn.net/gdkyxy2013/article/details/82873890

版权

Linux 同时被 2 个专栏收录

25 篇文章 6 订阅

订阅专栏

大数据

12 篇文章 0 订阅

订阅专栏

大数据集群在建立好之后，因为某些任务（例如处理SQL语句等）可能会出现各组件失联、CPU巨高或ssh登录不了的问题。我们可以通过清理缓存来解决内存的问题。大数据集群因为每天都会处理大量的数据，所以会有大量的缓存，如果不及时的清理就会出现节点失联等上述问题。

我们可以使用命令手动进行缓存的清理，命令如下：

1、To free pagecache, use
echo 1 > /proc/sys/vm/drop_caches

2、To free dentries and inodes, use
echo 2 > /proc/sys/vm/drop_caches

3、To free pagecache, dentries and inodes, use
echo 3 >/proc/sys/vm/drop_caches

但是大多数情况下，程序员更希望通过shell脚本和定时任务来使得清理缓存的工作自动执行。这里我们也给出相应的shell脚本，以小编所使用的集群为例。shell脚本如下：

#!/bin/bash

for i in {111,112,113}; 
do 
ssh 192.168.0.$i "echo 3 > /proc/sys/vm/drop_caches"; 
done

通过crontab定时任务对上面的定时脚本进行调度，会实现在指定的时间对大数据的集群进行清理的工作。例如：

#每天晚上8点执行清理缓存的操作

0 20 * * * bash /opt/files/cache/delete_cache.sh

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

象在舞

关注关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

快速构建大数据缓存

孤剑之家

12-27

1501

场景：系统运行于正式环境后，发现时常发生OOM （OutOfMemory），通过 Windbg dump 了几个内存后发现很多缓存对象无法回收【分析过程另起新篇叙述】，于是想到如何处理缓存？方案：由于系统中的缓存都是采用 Hashtable 直接建立 key, value 来缓存对象，属于 Strong Handle类型，当然第一反应就是建

CM+CDH 从0-1大数据集群基本搭建超级详细步骤

bwf317的博客

12-10

580

一：环境准备：创建虚拟机命名为：democdh （虚拟机磁盘至少选60G，内存也要尽可能大写，我选的8G）修改Windows中的host文件添加主机域名映射： 192.168.133.222 democdh 修改虚拟机democdh主机名：命令：vi /etc/hostname 内容：democdh 修改域名映射：命令：vi /etc/hosts 最后一行后添加内容：192.168.133.222 democdh 修改ip地址以及网管等：命令：vi /etc/sysconfi...

参与评论您还未登录，请先登录后发表或查看评论

大数据缓存处理

06-17

大数据缓存处理解决方案，参见博客地址：https://blog.csdn.net/yangxiaobo118/article/details/80716709，内涵数据库文件，分布式项目文件，部署文档，以及演示录像。

大数据集群缓存清理

数据科学知识库

07-20

438

1.在集群中编写shell脚本：vim drop_cache 2.添加执行权限：chmod +x drop_cache 3.执行文件：bash drop_cache echo "开始清理集群缓存~" && sync && for i in {13,12,11} do ssh 10.105.198.$i "sudo sh -c '/usr/bin/echo 3 > /proc/sys/vm/drop_caches'"; done && echo "缓

深度解析数据缓存技术

热门推荐

俗科技的博客

03-21

1万+

缓存是分布式系统中的重要组件，主要解决高并发，大数据场景下，热点数据访问的性能问题。提供高性能的数据快速访问。（1）先写缓存，再写数据库[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GuaslfbG-1675935082869)(null)] 假如缓存写成功，但写数据库失败或响应延迟，则下次读取（并发读）缓存时，就出现脏读。（2）先写数据库，再写缓存。

大数据Hadoop集群删除节点

Fay_Linux的博客

07-19

1066

Hadoop集群删除节点 nn01主机 [root@nn01 ~]# cat /usr/local/hadoop/etc/hadoop/slaves //注释或删除node4 node1 node2 node3 #node4 [root@nn01 hadoop]# tail /usr/local/hadoop/etc/hadoop/hdfs-site.xml //修改配置文件 … ...

大数据集群卸载CM，卸载CDH，清除CDH 文件

05-06

在IT行业中，大数据集群的管理和运维是一项复杂的工作，其中Cloudera Manager（CM）和CDH（Cloudera Distribution Including Apache Hadoop）是常见的管理工具和Hadoop发行版。当需要卸载CM和CDH时，这是一个涉及多...

Ambari以及HDP搭建大数据集群

weixin_43790195的博客

04-26

1133

注： 1、主机均为centos7 2、安装使用root用户， 3、避免权限问题导致的不成功四台主机安装，分配如下： hdp-01 作为：ambari-serrver，hdp-02~hdp-04 作为ambari-agent 一、安装前的系统设定 1) 修改机器名、Hosts文件 # vim /etc/hostname hdp-01 # vim /etc/hosts 192.168.3....

大数据集群安装学习笔记

大数据基础入门教程

02-11

434

目录 1 安装部署........................................................................... 4 1.1 solr单节点安装部署................................................................. 4 1.1.1 下载......................

CentOS 6.10大数据集群搭建：hadoop+spark+hive+HBase详细指南

执行`yum clean all`清理缓存，之后运行`yum makecache`生成新的缓存。集群中的时间同步是至关重要的，因为大数据组件之间的协调依赖于精确的时间。在centOS 6.10上，可以使用`tzselect`命令来选择合适的时区。在`...

集群节点内存爆满优化

07-04

本人在搭建完集群，发现有时候集群某个节点内存爆满，导致很卡，看着难受，需要清理一下

大数据时代性能与缓存的优化

12-17

大数据时代，数据库，页面，缓存之间的优化

大数据之（一）——缓存处理

Think In JAVA—Max

05-15

5782

缓存就是数据交换的缓冲区，当应用程序需要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话再从内存中找。由于缓存的运行速度比内存快得多，所以使用缓存就大大提高了数据查找的效率。缓存可以视为主数据的缩影，是内存中少部分数据的复制品

清理节点因容器运行导致的内存占用过多，释放节点缓存

Ever_glow的博客

01-11

1523

容器往往会因为内存溢出而down掉，但是检查内存使用情况却显示占用内存很少，这种情况大多数由于容器的cache太多，占用了内存，导致内存的剩余不足，从而容器down掉。可以使用命令 free -h 查看节点与容器内部的cache使用情况，如果剩余很少，需要手动清除一下。常用的释放缓存的命令有 sync echo 1 > /proc/sys/vm/drop_caches 一般容器在执行完上述代码后就会将缓存释放，部分特殊设定的容器，如某些redis在执行此语...

Redis集群清缓存

谁还不是小白鼠的博客

11-06

3165

Redis集群拿三主三从为例，需要在三个master节点进行缓存清理 ./redis-cli -p 7380 --登陆redis客户端 auth password –如果redis未设置密码忽略此步骤 keys * --如果key数量庞大，不建议使用*来查看 cluster nodes --查看主节点，清理缓存必须在主节点清理 d...

大数据和分布式入门：主流分布式缓存组件(一)

bojikeqian的博客

10-09

409

在大数据处理当中，核心指导思想始终是分布式，基于分布式思想，我们有了Hadoop等开源技术框架，能够以更低的成本完成企业大数据系统平台搭建，支持业务进展。今天大数据和分布式入门，我们主要来聊聊主流的大数据分布式缓存组件。分布式缓存服务 大数据处理平台主要由上层的分布式计算组件和底层的分布式存储系统两层构成。存储层的热门产品主要有HDFS、Ceph及OpenStack Swift等，计算层的热门产品主要有MapReduce和Spark等。以Hadoop生态为例，存储组件为HDFS，计算组件是MapRed

大数据最全两大数据库缓存系统实现对比_两大缓存，牛逼