http://www.ibm.com/developerworks/cn/linux/l-cn-optimization/index.html#icomments
里面讲了些多核多线程程序优化的方法:
1. 把原来的单线程改写成多线程。
2. 针对Cache的优化这节很给力,原来还可以这样子耍cache,通过在apple数据结构a和b的成员变量之间加上一个比较大的变量,迫使Cache unit 不能同时包含a和b,这样a和b就不需要同时写入写出。从而防止两个核之间的cache数据的同步。
3. cpu亲和力-affinity.