我有一个用C语言编写的库,我有两个用C和C编写的应用程序.这个库是一个通信库,所以其中一个API调用如下所示:
int source_send( source_t* source,const char* data );
在C应用程序中,代码执行以下操作:
source_t* source = source_create();
for( int i = 0; i < count; ++i )
source_send( source,"test" );
C应用程序执行此操作的位置:
struct Source
{
Source()
{
_source = source_create();
}
bool send( const std::string& data )
{
source_send( _source,data.c_str() );
}
source_t* _source;
};
int main()
{
Source* source = new Source();
for( int i = 0; i < count; ++i )
source->send( "test" );
}
在英特尔酷睿i7上,C代码每秒产生的消息几乎增加了50%.
而在英特尔酷睿2双核处理器上,它每秒产生的消息数量几乎完全相同. (核心i7有4个核心,每个核心有2个处理线程)
我很好奇硬件执行什么样的魔术才能解决这个问题.我有一些理论,但我想我会得到一个真正的答案:)
编辑:评论中的其他信息
编译器是visual C,所以这是一个windows Box(两者都是)
通信库的实现创建了一个新线程来发送消息. source_create是创建此线程的原因.