众所周知ntohs用来将本机字节序列转换为网络字节序列,如何写一个高性能的实现呢?
先写一个能正常工作的:
代码如下
执行后与系统自带的对比性能,运行时间输出如下:
219
62
性能相差很多呀,看来得用汇编写个改进版本
运行结果如下:
188
62
性能有所改进,但与系统实现比较依然很慢,并没有显著改进性能,看来还得改进,应该是prolog代码和epilog代码所导致的性能不佳,
只好动用naked的了,将函数属性设置为naked。
运行比较
47
62
性能比系统的更好呀,my god :)
以上运行结果数据都是在debug版本下得出来的,release版本情况好像差不多,以上三种方式性能数据如下:
32
31
31
可见编译器的优化功能非常强大。