内存那些事之分配优化

最新推荐文章于 2024-06-08 21:28:41 发布

ybt631

最新推荐文章于 2024-06-08 21:28:41 发布

阅读量2.8k

收藏 2

点赞数 1

分类专栏： C/C++ 内存池文章标签：优化数据结构 list 多线程 null hook

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ybt631/article/details/6863229

版权

C/C++ 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

内存池

1 篇文章 0 订阅

订阅专栏

对于C++开发而言，内存分配优化几乎每个项目优化的必须课题.其实现方式也是五花八门.本文重点总结下这方面的经验.

1.通用分配/释放的优化

对于windows应用程序的内存分配

,从上层往下,以此是malloc/new-->HeapAlloc-->VirtualAlloc.通用的内存分配优化,一般会选择基于VirtualAlloc重新实现malloc.以期替代c标准函数malloc.

现在开源的这样的实现，效率比较好的有tcmalloc和nedmalloc.前者是google的众多基本库之一.后者是历史悠久的一个malloc开源实现.他们的实现原理基本一致,TLS+struct MemPool{ struct MemPool* next;}这样的结构实现.其中实现的大部分代码在于如何构建内存地址,以便在free时通过地址获得它的大小.就性能而言，它们也基本一致.

不过tcmalloc有个好处,如果链接了它的dll,会自动hook所有分配函数,并替换之.能够非常方面的集成到程序中.性能来说，它比默认的分配快很多.在我们开发的游戏,集成后在某些机器上能带来30%以上的fps提升.

2.Free带大小的分配和释放

虽然tcmalloc有很好的表现,但是在某些情况下,比如stl容器,和每次只分配一个的对象,他们在free时，会带上释放内存的大小.

这样我们可以简化tcmalloc实现,直接每个分配大小映射一个Mem链表,多线程依然采用TLS解决.典型的逻辑大概如下:

Void * fast_malloc(size_t sz)

{

// g_mainList采用TLS存储.对于过大尺寸的内存分配采用默认分配.

MemPool*& pHead = g_mainList[sz];

If(!pHead )

{

// 初始化链表

}

MemPool* pRet = pHead;

pHead = pHead->next;

Return pRet;

}

Void fast_free(void* p, size_t sz)

{

MemPool* pNew = (MemPool*)p;

MemPool*& pHead = g_mainList[sz];

pNew->next = pHead;

pHead = pNew;

}

这样实现后,在内存分配/释放分别在不同线程的情况下,会造成内存泄漏.可以针对每个大小的链表添加一个计数,超过一定个数就统一释放.一般来说这个会比tcmalloc还快20%.

3.Std::map/list等特殊容器的适配器优化

map/list这样的容器,总是一次分配一个结点.对于他们的适配器,可以更特殊的处理.

这样大概有两个成员变量.

template<class Ty>

class FastOneAllocator

{

MemPool* m_poolHead;

// 记录分配的内存,方便最终释放

MemPool* m_ListHead;

// 内存链.分配/释放原理跟上文类似

};

释放/分配的逻辑如下:

pointer allocate(size_type _Count)

{

if(m_ListHead == NULL)

{

//有个默认条件:sizeof(Ty)必须大于等于sizeof(MemPool)

void* pNew = malloc(COUNT_PER*sizeof(Ty)+sizeof(MemPool))

//todo: 把内存通过链表连起来.

MemPool* pNewHead = (MemPool*)pNew;

pNewHead->next = m_poolHead;

m_poolHead = pNewHead;

}

// 同fast_malloc逻辑.

}

//析构函数内.

~FastOneAllocator()

{

MemPool* lastPtr = NULL;

for(; m_poolHead; m_poolHead = lastPtr)

{

lastPtr = m_poolHead->_next;

free(m_poolHead);

}

}

如果list以FastOneAllocator作为适配器.list::swap就会问题.

典型的调用如下:

list<int> t2;

{

list<int> t1;

t1.push_back(1);

t2.swap(t1);

//t1的适配器析构把交换过去的t2内存都释放了

}

类似list这样的数据结构,都是通过一个head来把所有容器内数据串联起来的.list::swap主要是通过直接交换head来达到swap整个数据结构的目的.

为解决这个问题,可以统一把list::swap用std::swap实现.这里效率相对来说有所降低.但是考虑到这样的调用实际中并不常见,也是可以接受的。

实际测试的结果, FastOneAllocator相对于以fast_malloc为基础构建的适配器,快15%左右.

ybt631

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ybt631 CSDN认证博客专家 CSDN认证企业博客

码龄20年

暂无认证

17: 原创

43万+: 周排名

51万+: 总排名

3万+: 访问

: 等级

583: 积分

6: 粉丝

6: 获赞

3: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

多线程典型问题实现总结
ybt631 回复 dfasri: 即便如此，依然可以根据无锁实现的思路,写出高效的多线程读的实现. 由于存储的是链表,只需要很简单的操作，就可以copy到所有数据.对这部分采用cmpxchg指令高效锁.
多线程典型问题实现总结
ybt631 回复 dfasri: 前面有说了，问题的假设就是只有一个线程读。所以不会有问题.
多线程典型问题实现总结
dfasri: 你的无锁实现, 虽然说是除push线程以外, 其他线程只读. 你上述有什么机制来确保同一个数据不会被重复读取的?

最新文章

2011年6篇

2010年1篇

2007年3篇

2006年8篇

2005年2篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值