Mit6.S081-实验8-locks

最新推荐文章于 2024-08-15 17:16:34 发布

解析Ta

最新推荐文章于 2024-08-15 17:16:34 发布

阅读量10w+

点赞数 4

分类专栏：操作系统文章标签：操作系统

本文链接：https://blog.csdn.net/u013577996/article/details/114639519

版权

操作系统专栏收录该内容

15 篇文章 89 订阅

订阅专栏

Mit6.S081-实验8-locks

一、实验准备
二、Memory allocator
三、Buffer cache

一、实验准备

在本实验，你将在 重构代码以提升并行 上获得经验。
多核机器低并行的常见症状是high lock contention。
提高并行，通常包括改变数据结构和锁策略来减少争用。
你将为xv6 memory allocator和block cache这么做。
在写代码之前，确保阅读xv6 book的以下部分：
Chapter6："Locking"和对应代码
Section3.5："Code：Physical memory allocator"
Section8.1到8.3："Overview","Buffer cache layer","Code:Buffer cache"

切换到lock分支

git fetch、git checkout lock、make clean

二、Memory allocator

1，实验要求

程序user/kalloctest压测xv6的memory allocator：
3个进程grow、shrink它们的地址空间，导致一些调用：kalloc和kfree。
kalloc和kfree获取kmem.lock。
kalloctest打印（”#fetch-and-add”）acquire中的循环迭代编号，由于尝试获取另外一个核已经持有的锁，kem lock和少量其它锁。
acquire循环迭代编号是一个lock contention的粗略测量。
kalloctest的输出看起来类似之前完成的实验。

$ kalloctest
start test1
test1 results:
--- lock kmem/bcache stats
lock: kmem: #fetch-and-add 83375 #acquire() 433015
lock: bcache: #fetch-and-add 0 #acquire() 1260
--- top 5 contended locks:
lock: kmem: #fetch-and-add 83375 #acquire() 433015
lock: proc: #fetch-and-add 23737 #acquire() 130718
lock: virtio_disk: #fetch-and-add 11159 #acquire() 114
lock: proc: #fetch-and-add 5937 #acquire() 130786
lock: proc: #fetch-and-add 4080 #acquire() 130786
tot= 83375
test1 FAIL

对于每个锁，acquire持有：为了该锁，acquire的调用次数；
acquire循环中，尝试获取但没能设置锁的次数。
kalloctest调用一个system call，让kernel打印那些对于kmem、bcache lock计数，（这是本实验的关注点），也打印5个争用最强烈的锁。
如果存在锁争用，acquire循环迭代中的计数将很多大。
system call返回 为了获取kmem和bcache lock的循环迭代总数。

对于本实验，你必须使用一个专用unloaded多核机器。
如果你使用一个正在做其他事的机器，kalloctest打印的计数将是无用的。
你可以使用专用Athena workstation，或你的笔记本电脑，但不要使用dialup机器。

kalloctest中锁争用的根本原因是kalloc()只有一个free list，受单lock保护。
为了移除锁争用，你将不得不重新设计memory allocator来避免一个单独lock和list。
基本想法是：每个CPU持有一个free list，每个list有其自己的锁。
不同CPU上的分配和释放可以并行执行，因为每个CPU将在不同的list上操作。
主要挑战将是处理这样的场景：
某个CPU上的free list空了，但另外CPU list有free memory。
在这种情况下，cpu必须steal另外CPU free list的一部分。
stealing可能引发锁争用，但不常见。

你的工作是实现每个CPU freelist，当CPU free list为空时stealing。
你必须让所有锁名以kmem开头。
你应该为每把锁调用initlock，传入一个以kmem开头的名字。
执行kalloctest来看是否你的实现已经减少了锁争用。
为了检查仍可以分配所有内存，执行usertests sbrkmuch。
你的输出将和下面显示的相似，减少了kmem lock争用总数，尽管具体数字不同。
确保usertests中所有测试通过。make grade应该表明kalloctests通过。

$ kalloctest
start test1
test1 results:
--- lock kmem/bcache stats
lock: kmem: #fetch-and-add 0 #acquire() 42843
lock: kmem: #fetch-and-add 0 #acquire() 198674
lock: kmem: #fetch-and-add 0 #acquire() 191534
lock: bcache: #fetch-and-add 0 #acquire() 1242
--- top 5 contended locks:
lock: proc: #fetch-and-add 43861 #acquire() 117281
lock: virtio_disk: #fetch-and-add 5347 #acquire() 114
lock: proc: #fetch-and-add 4856 #acquire() 117312
lock: proc: #fetch-and-add 4168 #acquire() 117316
lock: proc: #fetch-and-add 2797 #acquire() 117266
tot= 0
test1 OK
start test2
total free number of pages: 32499 (out of 32768)
.....
test2 OK
$ usertests sbrkmuch
usertests starting
test sbrkmuch: OK
ALL TESTS PASSED
$ usertests
...
ALL TESTS PASSED

2，一些提示

你可以使用kernel/param.h中常量NCPU。
让freerange把所有空闲内存给正在执行freerange的CPU。
函数cpuid返回当前cpu核编号，但仅在中断关闭时可以调用它并使用它的结果。
你应该使用push_off()和pop_off()来关闭、开启中断。
看kernel/sprintf.c中的snprintf函数，为string formatting找灵感。
可以将所有锁命名为kmem。

3，具体实现

1）修改kernel/kalloc.c，修改原有结构体声明kmem，定义结构体数组kmemArray[NCPU]。
在这里插入图片描述
2）修改kernel/kalloc.c，修改kinit方法，对NCPU个kmem结构体初始化。

3）修改kernel/kalloc.c，修改kfree方法，获取当前cpuid，释放对应freelist。

4）修改kernel/kalloc.c，修改kalloc方法，当前CPU freelist为空时，从其他CPU freelist处获取。
在这里插入图片描述

4，测试效果

在这里插入图片描述

三、Buffer cache

1，实验要求

这半个作业独立于上半个；不管你是否完成了上半个，你都可以处理这半个并通过测试。
如果多进程集中地使用文件系统，它们可能会竞争获取bcache.lock，保护kernel/bio.c中的磁盘block cache。
bcachetest创建多个进程重复读取不同文件，产生bcache.lock上的竞争。它的输出如下（在你完成本实验之前）：

$ bcachetest
start test0
test0 results:
--- lock kmem/bcache stats
lock: kmem: #fetch-and-add 0 #acquire() 33035
lock: bcache: #fetch-and-add 16142 #acquire() 65978
--- top 5 contended locks:
lock: virtio_disk: #fetch-and-add 162870 #acquire() 1188
lock: proc: #fetch-and-add 51936 #acquire() 73732
lock: bcache: #fetch-and-add 16142 #acquire() 65978
lock: uart: #fetch-and-add 7505 #acquire() 117
lock: proc: #fetch-and-add 6937 #acquire() 73420
tot= 16142
test0: FAIL
start test1
test1 OK

你可能会看到不同的输出，为获取bcache lock，acquire循环迭代次数将会很高。
如果你看到kernel/bio.c中的代码，你将看到bacache.lock保护cached block buffers list、每个block buffer的引用数量（b->refcnt）、cached block的标识（b->dev和b->blockno）。
修改block cache，以致于执行bcachetest时，在bcache中所有锁的acquire循环迭代次数接近0。
理想状态下，与block cache相关的所有锁计数之和应该为0，但如果和小于500也是可以的。
更改bget和brelse，以致于对bcache不同block的并发查看和释放不会在锁上冲突（例如，无需等待bcache.lock）。
你必须保证不变性：每个block最多一个副本被缓存。
当你完成时，你的输出应该和下面所示相似（尽管不完全一样）。
确保usertests仍然通过。当你完成时，make grade应该通过所有测试。

$ bcachetest
start test0
test0 results:
--- lock kmem/bcache stats
lock: kmem: #fetch-and-add 0 #acquire() 32954
lock: kmem: #fetch-and-add 0 #acquire() 75
lock: kmem: #fetch-and-add 0 #acquire() 73
lock: bcache: #fetch-and-add 0 #acquire() 85
lock: bcache.bucket: #fetch-and-add 0 #acquire() 4159
lock: bcache.bucket: #fetch-and-add 0 #acquire() 2118
lock: bcache.bucket: #fetch-and-add 0 #acquire() 4274
lock: bcache.bucket: #fetch-and-add 0 #acquire() 4326
lock: bcache.bucket: #fetch-and-add 0 #acquire() 6334
lock: bcache.bucket: #fetch-and-add 0 #acquire() 6321
lock: bcache.bucket: #fetch-and-add 0 #acquire() 6704
lock: bcache.bucket: #fetch-and-add 0 #acquire() 6696
lock: bcache.bucket: #fetch-and-add 0 #acquire() 7757
lock: bcache.bucket: #fetch-and-add 0 #acquire() 6199
lock: bcache.bucket: #fetch-and-add 0 #acquire() 4136
lock: bcache.bucket: #fetch-and-add 0 #acquire() 4136
lock: bcache.bucket: #fetch-and-add 0 #acquire() 2123
--- top 5 contended locks:
lock: virtio_disk: #fetch-and-add 158235 #acquire() 1193
lock: proc: #fetch-and-add 117563 #acquire() 3708493
lock: proc: #fetch-and-add 65921 #acquire() 3710254
lock: proc: #fetch-and-add 44090 #acquire() 3708607
lock: proc: #fetch-and-add 43252 #acquire() 3708521
tot= 128
test0: OK
start test1
test1 OK
$ usertests
  ...
ALL TESTS PASSED

请你把所有锁名以“bcache”开头。即你该为每个锁调用initlock，传入一个以“bcache”开头的名字。
减少block cache中的争用比kalloc更困难，因为bcache buffers确实在多进程间共享。
对于kalloc，给每个CPU它自己的allocator可以减少绝大多数争用；它们不会对block cache起作用。
我们建议你用哈希表（每个bucket一把锁）在cache中查看block序号。
某些情况下，你的方案有lock conflict是可以的：
1，当两个进程并发地使用相同block序号。bcachetest test0从不会这么做。
2，当两个进程同时在cache中miss时，需要找到一个未使用的block来替换。bcachetest test0从不会这么做。
3，无论你使用什么方案来区分blocks和locks，两个进程并发使用blocks都会产生conflict。
例如，两个进程使用blocks（它的block号哈希到哈希表同一位置）。
bcachetest.test0()可能这么做，取决于你的设计，但你应该尝试调整策略细节来避免confilcts（如，改变哈希表的尺寸）。
bcachetest的test1使用块比缓冲区，练习一些文件系统代码路径。

2，一些提示

1，阅读xv6书中block cache的描述（章节：8.1-8.3）。
2，使用固定数量的buckets，并不动态扩容hash表是可以的。使用素数（例如13）个buckets来减少哈希碰撞的可能性。
3，当buffer没有被找到，在哈希表中找一个buffer，并给该buffer分配一个entry必须是原子的。
4，移除list的所有buffers（bcache.head等等），用最后使用时间来标定buffers。（如，kernel/trap.c中用的ticks）。
因为这个改变，brelse无需获取bcache lock，bget可以基于时间标定选择LRU block。
5，bget中串行化删除是可以的。（例如，当在cache中没查到时，bget中选择一个buffer来重用）
6，你的方案，在一些场景中可能需要持有两个锁；
例如，在移除期间，你可能需要持有bcache lock和每个bucket的lock。确保你避免死锁。
7，当取代一个block，你可能移动一个struct buf从一个bucket到另外一个bucket，因为新block哈希到一个不同的bucket。
你可能有一个困难情况：新block可能哈希到与旧block一样的bucket。确保你在那种情况下避免死锁。
8，一些调试提示：实现bucket锁，但在bget开始、结束时保留全局bcache.lock acquire/release来串行化代码。
一旦确保无竞争情况正确时，移除全局锁，处理并发问题。你也可以执行make CPUS=1 qemu来测试单核。

3，具体实现

1）修改kernel/buf.h，新增tick，作为时间标记。
在这里插入图片描述
2）修改kernel/bio.c，新增NBUC，作为hash表bucket数量。

3）修改kernel/bio.c，修改bcache，去除head。

4）修改kernel/bio.c，定义结构体bMem，新增结构体数组bMem作为哈希表。

5）修改kernel/bio.c，在binit方法中新增哈希表中每个bucket lock初始化。
在这里插入图片描述
6）修改kernel/bio.c，新增replaceBuffer方法，用于LRU buffer赋值。

7）修改kernel/bio.c中的bget方法。

static struct buf*
bget(uint dev, uint blockno)
{
    struct buf *b;
	struct buf *lastBuf;

	// Is the block already cached?
	uint64 num = blockno%NBUC;
	acquire(&(hashTable[num].lock));
	for(b = hashTable[num].head.next, lastBuf = &(hashTable[num].head); b; b = b->next){
		if (!(b->next)){
			lastBuf = b;
		}
		if(b->dev == dev && b->blockno == blockno){
			b->refcnt++;
			release(&(hashTable[num].lock));
			acquiresleep(&b->lock);
			return b;
		}
	}

	struct buf *lruBuf = 0;
	acquire(&bcache.lock);
	for(b = bcache.buf; b < bcache.buf + NBUF; b++){
	    if(b->refcnt == 0) {
	    	if (lruBuf == 0){
	    		lruBuf = b;
	    		continue;
	    	}
			if (b->tick < lruBuf->tick){
				lruBuf = b;
			}
	    }
  	}

	if (lruBuf){
	  	uint64 oldTick = lruBuf->tick;
		uint64 oldNum = (lruBuf->blockno)%NBUC;
		if(oldTick == 0){
			replaceBuffer(lruBuf, dev, blockno, ticks);
			lastBuf->next = lruBuf;
			lruBuf->prev = lastBuf;
		}else {
			if (oldNum != num){
				acquire(&(hashTable[oldNum].lock));
				replaceBuffer(lruBuf, dev, blockno, ticks);
				lruBuf->prev->next = lruBuf->next;
				if (lruBuf->next){
					lruBuf->next->prev = lruBuf->prev;
				}
				release(&(hashTable[oldNum].lock));
				lastBuf->next = lruBuf;
				lruBuf->prev = lastBuf;
				lruBuf->next = 0;
			}else {
				replaceBuffer(lruBuf, dev, blockno, ticks);
			}
		}
	  	release(&bcache.lock);
		release(&(hashTable[num].lock));
		acquiresleep(&lruBuf->lock);
		return lruBuf;
	}
  	panic("bget: no buffers");
}