转自:http://fanqiang.chinaunix.net/a1/b5/20010612/100800481_b.html
inode size 倒底要多大才比較好?有人說如果小檔案多,則以 1024 byte 較好。
這樣的思考原則好像不是很謹慎。多少才叫『多』呢?我想我們需要一點定量的分析才對。
首先我們來『觀察』一下 inode size 大小對我們 filesystem (以下 filesystem 均簡稱 fs) 及系統的相對性影響:
- inode size 越小,inode table 越肥,可用空間越小。
- inode size 越小,link 就越長,越會拖慢速度。
- inode size 越小,空間利用率就越高。
此外,因為 x86 的 pagesize=4K 的特性,在做 mmap() 及 swap 這類的 virtual memory 動作時,如果 inode size 為 4K 的倍數,將較有效率。
所以,看來 inode size <4K 除了空間利用率較高以外,其餘全都是缺點。
而就一般實際經驗來講,空間利用率的提高,並不足以彌補因 inode table 的肥大而浪費掉的空間......所以一般而言 4K 是一個不錯的經驗值。
上面最後一點,我們提到了『空間利用率的提高,並不足以彌補因 inode table 的肥大而浪費掉的空間』一個事實;它的確是一個事實,除非您的 fs 是專供 BBS 這種系統而使用。以下是一些參考數據:
表一: inode size 和 inode table 大小關系
inode size(byte) inode table 在該 fs 上所佔掉的百分比 1024 12.57% (約 1/8) 2048 6.31% (約 1/4) 4096 3.19% 8192 1.63% 16384 0.84% 32768 0.45%
所以以一個 1GB 的 partition 來造 fs 為例,不同的 inode size 將會立刻 先使用掉的容量 (拿去存 inode table 了) 是:
表二: inode size 與 inode table 大小 (在 1GB fs 中)
inode size(byte) inode table 大小 1024 128.7MB 2048 64.6MB 4096 32.6MB 餘類推
試想,一個 1GB 的 fs 就只為了 inode size=1024 而就先用掉了 128MB 的空間, 除非將來我們的小檔案真的很多很多,不然是補不回來的。
再來我們舉例比較一下 inode size=1024 與 inode size=2048 的 fs:
以一個大小不到 1k 的檔存在 inode size=1024 的 fs 中,是比在 inode size=2048 的 fs 中省下了 1k 的空間;但在 1GB 的 fs □, 要有 (128.7-64.6) * 1024 = 65614 個這樣多的小檔案,才算是『賺到了』; 呵呵.....你的 fs □湊得出這麼多小於 1k 的檔嗎?
類推 512MB 的 fs □,就要有 32820 個小於 1k 的檔才算『賺到了』。
小於 1k 的檔,除非你是開 bbs 的,不然在同一個 file system 上 想湊出 10000 個都很難;
我想,不再舉個更實際的例子,恐怕還是有人不信。 以下是我以前對某個 1GB fs 中的 file size 統計:
表三: 本人某個舊 1GB fs 中的 file size 統計:
檔案大小的□圍 該大小□圍內的檔案個數 不到1K的 6538 1-2K 2053 2-4K 1565 4-8K 1064 8-16K 1011 16-32K 595 32K以上 1112
OK,看起來很明顯地,不滿 1k 大小的檔案個數,已經佔了快一半了; 所以直覺上會認為 inode size=1024 比較好?錯了......
以下是以 inode size 來看 (fs 為 1GB 大小) 相對浪費空間的大小:
表四: 檔案空間相對浪費大小與 inode size 對應表:
inode size(byte) 檔案空間相對浪費大小加上 inode table 大小 1024 131766KB (即 inode table 大小) 2048 72743KB (inode table size + 1K*6538) 4096 57208KB (inode table size + 3K*6538 + 2K*2053) 8192 81410KB (inode table size + 7K*6538 + 6K*2053.....) 16384 162959KB (餘請類推) 32768 354549KB
所以反而以 inode size=4k 最佳。
上面那些『空間相對浪費大小』計算上有點復雜, 不另說明. (呵呵, 搞不好我的算法是錯的......所以不敢公布算法)
以同樣的分析來看我的 bbs 的情況, inode size=1024 是最佳的, 因為小於 1k 的檔案竟然多達四萬個以上.
/usr 分析出來是以 inode size=2048 最佳。
但請注意, 以上只是空間利用率的分析, 不是速度上的分析......