微软strlen函数实现

最新推荐文章于 2022-02-24 21:19:17 发布

缘之一念

最新推荐文章于 2022-02-24 21:19:17 发布

阅读量1.1k

点赞数

分类专栏： C/C++ 文章标签：微软 byte string 汇编 windows 算法

C/C++ 专栏收录该内容

41 篇文章 0 订阅

订阅专栏

string equ [esp + 4] mov ecx,string test ecx,3 je short main_loop str_misaligned: mov al,byte ptr [ecx] add ecx,1 test al,al je short byte_3 test ecx,3 jne short str_misaligned add eax,dword ptr 0 align 16 redundant main_loop: mov eax,dword ptr [ecx] mov edx,7efefeffh add edx,eax xor eax,-1 xor eax,edx add ecx,4 test eax,81010100h je short main_loop mov eax,[ecx - 4] test al,al je short byte_0 test ah,ah je short byte_1 test eax,00ff0000h je short byte_2 test eax,0ff000000h je short byte_3 jmp short main_loop byte_3: lea eax,[ecx - 1] mov ecx,string sub eax,ecx ret byte_2: lea eax,[ecx - 2] mov ecx,string sub eax,ecx ret byte_1: lea eax,[ecx - 3] mov ecx,string sub eax,ecx ret byte_0: lea eax,[ecx - 4] mov ecx,string sub eax,ecx ret strlen endp end

前阵子看熊力的《WINDOWS用户态程序高效排错》的时候，在他BLOG（blogs.msdn.com/lixiong）里的用户反馈里看到的，据说是系统STRLEN的汇编代码

下面是熊力对这段代码的分析：
“这里对一个DWORD (EAX)的判断方法是:

1. 对EAX+0x7efefeff
2. 对EAX取反
3. 把1和2的结果作XOR，然后跟0x81010100h作test运算

研究了好久，理解如下:

问题的关键点在于，当且仅当EAX四个byte都不为0的时候，运算结果会是下面的pattern：
0??? ???0 ???? ???0 ???? ???0 ???? ????

分别解释如下:

如果第一个byte为0, 考虑第二个byte的最后一个bit。不管这个bit是0还是1,计算公式是:
(x+0) XOR (!x) =x xor !x=0
如果第一个byte不为0,肯定产生进位，考虑第二个byte的最后一个bit。不管这个bit是0还是1,计算公式是:
(x+1)XOR(!x)=!x xor !x=1

这就是上面0??? ???0 ???? ???0 ???? ???0 ???? ????第二个byte的第一个bit是0的来历

同理，第二,三,四个byte中的的第一个bit的0也是在前面所有的byte都不为0的时候才会出现，否则就会出现至少一个1

换句话说，上面的代码无法区分最高一个byte最高bit为0，其他bit为1的情况。这是这种算法的一个死穴。当出现比如0x80112233这样的 DWORD的时候，test eax,81010100h 计算的结果跟0x00112233一样。当然最后的结果不会有问题，因为 byte_3 -- byte_0里面会再次作判断。所以，如果用一连串的0x80112233作为字符串内容，strcpy的效率会大大下降

对于一个DWORD，导致这个因素的可能是
2^24/2^32=1/2^8=1/256

算是比较罕见了

从逻辑上说，最高byte是无法区分本身为1，或者是低byte进位的情况。所以单独的DWORD是无法判断出所有情况的，当前的做法已经算很有想法的了
”

size_t __cdecl mstrlen(const char* strdst) { if(NULL==strdst){ return 0; } const char* tmp=strdst; while( ((unsigned long)tmp & 0x03) != 0){ if('/0'==*tmp++){ return (size_t)(tmp-1-strdst); } } union uT{ unsigned long fourbytes; char chs[4]; }* u; while(1){ u=(uT*)tmp; if((( (~u->fourbytes) ^ (u->fourbytes+0x7EFEFEFF))& (~0x7EFEFEFF) )!=0){ for(int i=0;i<4;i++){ if(u->chs[i]=='/0'){ return (size_t)(tmp-strdst+i); } } } tmp+=4; } }

缘之一念

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
微软strlen函数实现

string equ [esp + 4] mov ecx,string test ecx,3 je short main_loopstr_misaligned: mov al,byte ptr [ecx]
复制链接

扫一扫

专栏目录