堆外缓存

转载自:https://www.cnblogs.com/scy251147/p/9634766.html
堆内缓存的劣势

事物都是有两面性的,堆内缓存在JVM的管理下,纵然无可挑剔,但是在GC过程中产生的程序小停顿和程序大停顿,则像一把利剑一样,斩断了对构造出完美高并发系统的念想。简单的以HashMap这个JDK自带的缓存组件为例,benchmark结果如下:

Benchmark Mode Cnt Score Error Units
localCacheBenchmark.testlocalCacheSet thrpt 20 85056.759 ± 126702.544 ops/s

其插入速度最快为85056.759+126702.544=211759.303ops,最慢为0,也就是每秒插入速度最快为20w,最慢为0。之所以为0,是因为HashMap中的数据在快速的增长过程中,引起了频繁的GC操作,为了给当前HashMap腾出足够的空间进行插入操作,不得不释放一些对象。频繁的GC,势必对插入速度有不小的影响,造成应用的偶尔性暂停。所以这也能解释为啥最慢的时候,ops为0了。 同时从benchmark数据,我们可以看到误差率为126702.544ops,比正常操作的85056.756要大很多,说明GC的影响,对HashMap的插入操作影响特别的大。

由于GC的存在,堆内缓存操作的ops会受到不小的影响,会造成原本小流量下10ms能够完成的内存计算,大流量下500ms还未完成。如果内存计算过于庞杂,则造成整体流程的ops吞吐量降低,也是极有可能的事儿。所以从这里可以看出,堆内缓存组件,在高并发的压力下,如果计算量巨大,尤其是写操作巨大,使其不会成为护城的利剑,反而成了性能的帮凶,何其可惧。

堆外缓存的优势

为了缓解在高并发,高写入操作下,堆内缓存组件造成的频繁GC问题,堆外缓存应运而生。从前面的描述我们知道,堆内缓存是受JVM管控的,所以我们不必担心垃圾回收的问题。但是堆外缓存是不受JVM管控的,所以也不受GC的影响导致的应用暂停问题。但是由于堆外缓存的使用,是以byte数组来进行的,所以需要自己进行序列化反序列化操作。目前已知的知名开源项目中,netty4的buffer pool采用了堆外缓存实现,具体的比对信息可以参考此处,具体的比对信息截图如下:
在这里插入图片描述

带有Direct字眼的即为offheap堆外Buffer,x轴为分配的内存大小,Y轴为耗时。从上面可以看出,小块内存分配,JVM要稍微优秀一点;但是大块内存分配,明显的堆外缓存要优秀一些。由于堆外Buffer操作不受GC影响,实际上性能更好一些。但是需要的垃圾回收管控也需要自己去做,要麻烦很多。

堆外缓存实现原理

说到堆外缓存实现原理,不可不提到sun.misc.Unsafe这个package包。此包提供了底层的Unsafe操作方法,让我们可以直接在堆外内存做数据分配操作。由于是底层包,所以用户层面很少用到,只是一些jdk里面的核心类库会用到。其实例的初始化方式如下:

public static Unsafe getUnsafe() {
Class cc = sun.reflect.Reflection.getCallerClass(2);
if (cc.getClassLoader() != null)
throw new SecurityException(“Unsafe”);
return theUnsafe;
}

可以看出是一个单例模式。让我们来尝试使用一下(下面代码是先分配了一个100bytes的空间,得到分配好的地址,然后在此地址里面放入1,最后将此地址里面的数据取出,打印出来):

long address = unsafe.allocateMemory(100);
unsafe.putLong(address,1);
System.out.println(unsafe.getLong(address));

但是在运行的过程中,我们却遇到了如下的错误:

java.lang.SecurityException: Unsafe
at sun.misc.Unsafe.getUnsafe(Unsafe.java:90)
at UnsafeTest.testUnsafe(UnsafeTest.java:18)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)

Process finished with exit code -1

可以看出,由于安全性的原因,我们是无法直接使用Unsafe的实例来进行数据操作的,主要原因是因为cc.getClassLoader()对theUnsafe实例做了过滤限制。但是我们可以直接用theUnsafe来实现,由于是private修饰,我们可以用反射来将private修饰改成public修饰,让其暴露出来供我们使用:

Field f = Unsafe.class.getDeclaredField(“theUnsafe”);
f.setAccessible(true);
Unsafe unsafe = (Unsafe) f.get(null);
long address = unsafe.allocateMemory(100);
unsafe.putLong(address,1);
System.out.println(unsafe.getLong(address));

这样就可以了,能够正确的获取运行结果。从这里我们可以看出,堆外内存必须自己分配地址空间,那么对应的,自己需要控制好地址边界,如果控制不好,经典的OOM Exception将会出现。这也是比堆内内存使用麻烦的地方。

上面的代码展示,其实已经说明了Unsafe方法的基本使用方式。如果想查看更多的Unsafe实现方式,个人推荐可以看看Cassandra源码中的中的Object mapper - Caffinitas里面关于Unsafe的实现。此类的名称为Uns.java,由于类精简,个人认为很值得一看,我贴出部分代码来:

static
{
try
{
Field field = Unsafe.class.getDeclaredField(“theUnsafe”);
field.setAccessible(true);
unsafe = (Unsafe) field.get(null);
if (unsafe.addressSize() > 8)
throw new RuntimeException(“Address size " + unsafe.addressSize() + " not supported yet (max 8 bytes)”);

        if (__DEBUG_OFF_HEAP_MEMORY_ACCESS)
            LOGGER.warn("Degraded performance due to off-heap memory allocations and access guarded by debug code enabled via system property " + OHCacheBuilder.SYSTEM_PROPERTY_PREFIX + "debugOffHeapAccess=true");

        IAllocator alloc;
        String allocType = __ALLOCATOR != null ? __ALLOCATOR : "jna";
        switch (allocType)
        {
            case "unsafe":
                alloc = new UnsafeAllocator();
                LOGGER.info("OHC using sun.misc.Unsafe memory allocation");
                break;
            case "jna":
            default:
                alloc = new JNANativeAllocator();
                LOGGER.info("OHC using JNA OS native malloc/free");
        }

        allocator = alloc;
    }
    catch (Exception e)
    {
        throw new AssertionError(e);
    }
}

。。。。。。
static long getLongFromByteArray(byte[] array, int offset)
{
    if (offset < 0 || offset + 8 > array.length)
        throw new ArrayIndexOutOfBoundsException();
    return unsafe.getLong(array, (long) Unsafe.ARRAY_BYTE_BASE_OFFSET + offset);
}

static int getIntFromByteArray(byte[] array, int offset)
{
    if (offset < 0 || offset + 4 > array.length)
        throw new ArrayIndexOutOfBoundsException();
    return unsafe.getInt(array, (long) Unsafe.ARRAY_BYTE_BASE_OFFSET + offset);
}

static short getShortFromByteArray(byte[] array, int offset)
{
    if (offset < 0 || offset + 2 > array.length)
        throw new ArrayIndexOutOfBoundsException();
    return unsafe.getShort(array, (long) Unsafe.ARRAY_BYTE_BASE_OFFSET + offset);
}

堆外缓存实现进阶

写到这里,原理什么的大概都懂了,我们准备进阶一下,写个基于Off-heap堆外缓存的Int数组,由于On-heap Array的空间请求分配到了堆上,所以这里自然而然的就把空间分配到了堆外。代码如下:

public class OffheapIntArray {

/**
 * 此list分配的地址
 */
private long address;

/**
 * 默认分配空间大小
 */
private static final int defaultSize = 1024;

/**
 * 带参构造
 * 由于Integer类型在java中占用4个字节,所以在分配地址的时候,一个integer,需要分配 4*8 = 32 bytes的空间
 * @param size
 * @throws NoSuchFieldException
 * @throws IllegalAccessException
 */
public OffheapIntArray(Integer size) throws NoSuchFieldException, IllegalAccessException {
    if (size == null) {
        address = alloc(defaultSize * 4 * 8);
    } else {
        address = alloc(size * 4 * 8);
    }
}

public int get(int index) throws NoSuchFieldException, IllegalAccessException {
    return getUnsafe().getInt(address + index * 4 * 8);
}

public void set(int index, int value) throws NoSuchFieldException, IllegalAccessException {
    getUnsafe().putInt(address + index * 4 * 8, value);
}

private Unsafe getUnsafe() throws IllegalAccessException, NoSuchFieldException {
    Field f = Unsafe.class.getDeclaredField("theUnsafe");
    f.setAccessible(true);
    return (Unsafe) f.get(null);
}

private long alloc(int size) throws NoSuchFieldException, IllegalAccessException {
    long address = getUnsafe().allocateMemory(size);
    return address;
}

public void free() throws NoSuchFieldException, IllegalAccessException {
    if (address == 0) {
        return;
    }
    getUnsafe().freeMemory(address);
}

}

我们来简单的测试一下:

@Test
public void testOffheap() throws NoSuchFieldException, IllegalAccessException {
OffheapIntArray offheapArray = new OffheapIntArray(10);
offheapArray.set(0,11111);
offheapArray.set(1,1112);
offheapArray.set(2,1113);
offheapArray.set(3,1114);
System.out.println(offheapArray.get(0));
System.out.println(offheapArray.get(1));
System.out.println(offheapArray.get(2));
System.out.println(offheapArray.get(3));
offheapArray.free();
}

输出结果如下:

11111
1112
1113
1114

可以看到得到了正确的输出结果。当然我这里只是简单的模拟使用。具体的使用方式,推荐如下两篇文章,可以对堆外内存的使用有更近一步的认识:

Guide to sun.misc.Unsafe

Java Magic. Part 4: sun.misc.Unsafe

堆外缓存组件实战

知道了堆外缓存的简单使用后,这里我们要更近一步,使用现有的堆外缓存组件到项目中。

目前在市面上,有诸多的缓存组件,比如mapdb,ohc,ehcache3等,但是由于ehcache3收费,所以这里不做讨论,主要讨论mapdb和ohc这两个。我们先通过benchmark来筛选一下二者的性能差异,由于这两个缓存组件提供的都是基于key-value模型的数据存储,所以benchmark的指标有9个,分别是get,set方法,hget,hset方法(value存储的是hashmap),sadd,smember方法(value存储的是set),zadd,zrange方法(value存储的是treeset)。

benchmark结果如下:

Benchmark Mode Cnt Score Error Units
OffheapCacheBenchmark.testMapdbGet thrpt 20 69699.610 ± 4578.888 ops/s
OffheapCacheBenchmark.testMapdbHGet thrpt 20 63663.523 ± 3595.413 ops/s
OffheapCacheBenchmark.testMapdbHGetAll thrpt 20 64235.582 ± 4009.039 ops/s
OffheapCacheBenchmark.testMapdbHSet thrpt 20 25777.077 ± 480.461 ops/s
OffheapCacheBenchmark.testMapdbSAdd thrpt 20 335.973 ± 39.353 ops/s
OffheapCacheBenchmark.testMapdbSet thrpt 20 39417.070 ± 830.689 ops/s
OffheapCacheBenchmark.testMapdbSmember thrpt 20 67432.314 ± 2799.983 ops/s
OffheapCacheBenchmark.testMapdbZAdd thrpt 20 21220.595 ± 1128.103 ops/s
OffheapCacheBenchmark.testMapdbZRange thrpt 20 45425.162 ± 4533.071 ops/s

Benchmark Mode Cnt Score Error Units
OhcheapOHCBenchmark.testOhcGet thrpt 20 1196976.452 ± 27291.669 ops/s
OhcheapOHCBenchmark.testOhcHGet thrpt 20 348383.355 ± 23304.696 ops/s
OhcheapOHCBenchmark.testOhcHGetAll thrpt 20 350798.417 ± 11870.685 ops/s
OhcheapOHCBenchmark.testOhcHSet thrpt 20 349370.322 ± 8619.813 ops/s
OhcheapOHCBenchmark.testOhcSAdd thrpt 20 11700.160 ± 611.794 ops/s
OhcheapOHCBenchmark.testOhcSet thrpt 20 538314.544 ± 132111.037 ops/s
OhcheapOHCBenchmark.testOhcSmember thrpt 20 458817.772 ± 15817.159 ops/s
OhcheapOHCBenchmark.testOhcZAdd thrpt 20 323979.906 ± 9842.344 ops/s
OhcheapOHCBenchmark.testOhcZRange thrpt 20 192776.479 ± 12988.484 ops/s

从上面的结果可以看出,ohc属于性能怪兽类型,性能十倍于mapdb。而且由于ohc本身支持entry过期,但是mapdb不支持。所以这里综合一下,选择ohc作为我们的堆外缓存组件。需要说明一下的是,在我进行benchmark测试过程中,堆外缓存中会进行大量的数据读写操作,但是这些读写ops整体非常平稳,从error和score的对比就可以看出。不会出现应用暂停的情况。说明GC对堆外缓存的影响是非常小的。

整体类结构图如下(考虑到扩展性,暂时将mapdb加入到了结构图中):

image

从整体的类组织结构图看来,使用了策略模式+模板模式组合的方式来进行。 屏蔽不同cache底层接口的不一致性,用的是策略模式;为不同的堆外缓存组件提供一致的操作方法用的是模板模式。组合起来使用就使得开发和扩展显得非常容易。

部分类的封装方式如下:

public class OhcCacheStrategy implements CacheStrategy {

/**
 * 日志
 */
private static Logger logger = LoggerFactory.getLogger(OhcCacheStrategy.class);

/**
 * 缓存组件
 */
public OHCache<byte[], byte[]> dataCache;

/**
 * 过期时间组件
 */
public OHCache<byte[], byte[]> expireCache;

/**
 * 缓存table最大容量
 */
private long level2cacheMax = 1024000L;

/**
 * 锁
 */
private final Object lock = new Object();

/**
 * 键过期回调
 */
public ExpirekeyAction expirekeyAction;

/**
 * db引擎初始化
 */
@PostConstruct
public void initOhcEngine() {
    try {
        dataCache = OHCacheBuilder.<byte[], byte[]>newBuilder()
                .keySerializer(new OhcSerializer())
                .valueSerializer(new OhcSerializer())
                .segmentCount(2 * 4)
                .hashTableSize((int) level2cacheMax / 102400)
                .capacity(2 * 1024 * 1024 * 1024L)
                .defaultTTLmillis(OffheapCacheConst.EXPIRE_DEFAULT_SECONDS * 1000)
                .timeouts(true)
                .timeoutsSlots(64)
                .timeoutsPrecision(512)
                .eviction(Eviction.LRU)
                .build();
        logger.error("ohc data cache init ok...");
        expireCache = OHCacheBuilder.<byte[], byte[]>newBuilder()
                .keySerializer(new OhcSerializer())
                .valueSerializer(new OhcSerializer())
                .segmentCount(1)
                .hashTableSize((int) level2cacheMax / 102400)
                .capacity(2 * 1024 * 1024 * 1024L)
                .defaultTTLmillis(OffheapCacheConst.EXPIRE_DEFAULT_SECONDS * 1000)
                .timeouts(true)
                .timeoutsSlots(64)
                .timeoutsPrecision(512)
                .eviction(Eviction.NONE)
                .build();
        logger.error("ohc expire cache init ok...");
    } catch (Exception ex) {
        logger.error(OffheapCacheConst.PACKAGE_CONTAINER_OHC + OffheapCacheConst.ENGINE_INIT_FAIL, ex);
        AlarmUtil.alarm(OffheapCacheConst.PACKAGE_CONTAINER_OHC + OffheapCacheConst.ENGINE_INIT_FAIL, ex.getMessage());
        throw ex;
    }
}

@Override
public <T> boolean putEntry(String key, T entry, long expireAt) {
    synchronized (lock) {
        byte[] entryKey = SerializationUtils.serialize(key);
        byte[] entryVal = SerializationUtils.serialize((Serializable) entry);
        //缓存数据入库
        if (dataCache.put(entryKey, entryVal, expireAt)) {
            //过期时间入库
            putExpire(key, expireAt);
            //返回执行结果
            return true;
        }
        return false;
    }
}

@Override
public <T> T queryEntry(String key) {
    byte[] result = dataCache.get(SerializationUtils.serialize(key));
    if (result == null) {
        return null;
    }
    return SerializationUtils.deserialize(result);
}

@Override
public long queryExpireTime(String key) {
    byte[] entryKey = SerializationUtils.serialize(key);
    return expireCache.get(entryKey) == null ? 0 : SerializationUtils.deserialize(expireCache.get(entryKey));
}

@Override
public boolean removeEntry(String key) {
    byte[] entryKey = SerializationUtils.serialize(key);
    if (dataCache.remove(entryKey)) {
        removeExpire(key);
        return true;
    }
    return false;
}

@Override
public boolean removeAll() {
    Iterable<byte[]> dataKey = () -> dataCache.keyIterator();
    dataCache.removeAll(dataKey);

    Iterable<byte[]> expireKey = () -> expireCache.keyIterator();
    expireCache.removeAll(expireKey);

    return true;
}

@Override
public List<String> queryKeys() {
    List<String> list = new ArrayList<>();
    Iterator<byte[]> iterator = expireCache.keyIterator();
    while (iterator.hasNext()) {
        list.add(SerializationUtils.deserialize(iterator.next()));
    }
    return list;
}

/**
 * key过期时间同步入库
 *
 * @param key
 * @param expireAt
 */
private void putExpire(String key, long expireAt) {
    try {
        expireCache.put(SerializationUtils.serialize(key), SerializationUtils.serialize(expireAt));
    } catch (Exception ex) {
        logger.error("key[" + key + "]过期时间入库失败...");
    }
}

/**
 * 同步清理过期键
 *
 * @param key
 */
private void removeExpire(String key) {
    try {
        if (expireCache.remove(SerializationUtils.serialize(key))) {
            if (expirekeyAction != null) {
                expirekeyAction.keyExpiredNotification(key);
            }
        }
    } catch (Exception ex) {
        logger.error("key[" + key + "]过期时间清除失败...");
    }
}

}

上面这个类是堆外缓存的核心策略类。所有其他的数据模型读写操作都可以依据此类来扩展,比如类似redis的sortedset,value可以存储一个Treeset即可。需要说明一下,上面代码中,dataCache主要用于存储数据部分,expireCache主要用于存储键过期时间。以便于可以实现键主动过期和被动过期功能。用户添加删除键的时候,会同步删除expireCache中的键,以便于二者能够统一。由于ohc本身并未实现keyExpireCallback,所以这里我实现了这个功能,只要有键被移除(主动删除还是被动删除,都会触发通知),就会通知用户,用户可以按照如下方式使用:

@PostConstruct
public void Init() {
ohcCacheTemplate.registerExpireKeyAction(key -> {
logger.error(“key " + key + " expired…”);
});
}

键被动过期功能,模仿了redis的键被动驱逐方式,实现如下:

public class OffheapCacheWorker {

/**
 * 带参注入
 *
 * @param cacheStrategy
 */
public OffheapCacheWorker(CacheStrategy cacheStrategy) {
    this.cacheStrategy = cacheStrategy;
    this.offheapCacheHelper = new OffheapCacheHelper();
}

/**
 * 日志
 */
private static Logger logger = LoggerFactory.getLogger(OffheapCacheWorker.class);

/**
 * 缓存帮助类
 */
private OffheapCacheHelper offheapCacheHelper;

/**
 * 缓存构建器
 */
private CacheStrategy cacheStrategy;

/**
 * 过期key检测线程
 */
private Thread expireCheckThread;

/**
 * 线程状态
 */
private volatile boolean started;

/**
 * 线程开启
 *
 * @throws IOException
 */
public synchronized void start() {
    if (started) {
        return;
    }
    expireCheckThread = new Thread("expire key check thread") {
        @Override
        public void run() {

            logger.error("expire key check thread start...");

            while (!Thread.currentThread().isInterrupted()) {
                try {
                    processLoop();
                } catch (RuntimeException suppress) {
                    logger.error("Thread `" + getName() + "` occured a error, suppressed.", suppress);
                    throw suppress;
                } catch (Exception exception) {
                    logger.error("Thread `" + getName() + "` occured a error, exception.", exception);
                }
            }
            logger.info("Thread `{}` was stopped normally.", getName());
        }
    };
    expireCheckThread.start();
    started = true;
}

/**
 * 线程停止
 *
 * @throws IOException
 */
public synchronized void stop() throws IOException {
    started = false;
    if (expireCheckThread != null) {
        expireCheckThread.interrupt();
    }
}

/**
 * 过期键驱逐
 * 模仿的redis键过期机制

 */
private void processLoop() throws InterruptedException {

    //每次采集样本数
    int sampleCheckNumber = 20;

    //过期key计数
    int sampleExpiredCount = 0;

    //抽样次数迭代
    int sampleCheckIteration = 0;

    //缓存的key
    List<String> keys = cacheStrategy.queryKeys();

    //抽样开始时间
    long start = System.currentTimeMillis();

    //循环开始
    do {

        //键数量
        long expireContainerSize = keys.size();

        //默认为键数量
        long loopCheckNumber = expireContainerSize;

        //每次检查的键数量,如果超过样本数,则以样本数为准
        if (loopCheckNumber > sampleCheckNumber) {
            loopCheckNumber = sampleCheckNumber;
        }

        //开始检测
        while (loopCheckNumber-- > 0) {
            //取随机下标
            int rndNum = offheapCacheHelper.getRandomNumber(toIntExact(expireContainerSize) + 1);
            //取随机键
            String rndKey = keys.get(rndNum);
            //获取过期时间
            long expireTime = cacheStrategy.queryExpireTime(rndKey);
            //过期时间比对
            if (expireTime <= System.currentTimeMillis()) {
                //键驱逐
                boolean result = cacheStrategy.removeEntry(rndKey);
                if (result) {
                    expireContainerSize--;
                    sampleExpiredCount++;
                }
            }
        }
        //抽样次数递增
        sampleCheckIteration++;

        //抽样达到16次(16的倍数,&0xf都为0)且本批次耗时超过0.5秒,将退出,避免阻塞正常业务操作
        if ((sampleCheckIteration % 16) == 0 && (System.currentTimeMillis() - start) > 300) {
            logger.error("清理数据库过期键操作耗时过长,退出,预备重新开始...");
            return;
        }
    } while (sampleExpiredCount > sampleCheckNumber / 4);
    Thread.sleep(1500);
}

}

键被动驱逐,会随机抽取20个key检测,如果过期键小于5个,则直接进行下一次抽样。否则将进行键驱逐操作。一旦抽样次数达到限定次数且键驱逐耗时过长,为了不影响业务,将会退出本次循环,继续下一次循环操作。此worker在后台运行,实测6W个过期key一起过期,cpu占用控制在10%,60w个过期key基本上一起过期,cpu占用控制在60%左右。达到预期效果。在大量的读写操作过程中,可以看到堆内内存几乎没有变化。

写到最后,上面就是这次我要介绍的堆外缓存的整体内容了,从Unsafe讲到原理,从实现讲到ohc,希望大家能够提出更好的东西来,多谢。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值