1.strcmp源码
在标准C中,这个函数可以被写成;
int strcmp(const char* s1, const char* s2)
{
while(*s1 && *s2 && *s1 == *s2)
s1++, s2++;
return *(unsigned char*)s1 - *(unsigned char*)s2;
}
其实原本的函数在进行安全检查的时候并没有在while()中加入对s2的检查,但是这种函数一般是比较底层的,我们在写的时候还是要加上相关的安全检查。
那么我们在返回s1和s2的比较结果的时候为什么要将其转换为unsigned char呢?
我们可以看一个ASCII码表:
我们可以观察到,在128-255这个过程中还是有相应的码的,譬如’<<’这个符号我们在表中可以查到是173,但是如果对应对char型的话,他的值-45,那么在对这个符号和’a’进行比较的时候,如果按照char型的解释方式,我们得到的值一定是负数的;
这样得到的结果一定是错误的。
那么有的人会问:为什么不直接将函数的形参的类型定成char型呢,我估计是因为char的时候频率太高了,没有必要因为一个函数而改变使用习惯吧。有其他原因欢迎讨论。
2.memset的相关函数代码及使用上的注意
当天写的东西就可以更新了,感觉不错,下面写一下memset的源代码
void* memset(void* s, int c, size_t n)
{
unsigned char* p = s;
while(n--)
*p++ = (unsigned char)c;
return s;
}
起始这个我觉得要是我自己,我会增加入输入安全检查,下面是我写更改了一下的代码:
void* memset(void* s, int c, size_t n)
{
if(s == NULL || n <= 0)
return NULL;
unsigned char* p = s;
while(n--)
*p++ = (unsigned char)c;
return s;
}
下面说关于这个函数中是要注意的几点:
a.因为该函数是将一段内存初始化,并且它是按照字节来复制的,所以你想将一个int数组中的元素都设置成5,这么做是很容易出错的:
int *a = new int[10];
memset(a, 5, 10 * sizeof(int));
for (int i = 0; i < 10; i++)
cout << a[i] << endl;
return 0;
这个程序会输出每个元素的值:84215045
为什么不是我们希望的5呢,因为是按照字节来复制的,那么84215045转换成2进制就是:00000101 00000101 00000101 00000101
大家一看这个估计就懂了,所以memset最好利用在结构体或者数组的初始化是很方便的。
b.函数中我们可以看到返回了指针s,这是为了链式使用,譬如:strlen(memset(s, c, n));
c.还有一点大家需要注意,就是我们在用数字c来初始化每个字节的时候必须要进行强制类型转换(unsigned char),这样才不会导致每个字节因为数字c而产生溢出;
d.为什么在函数内部采用unsigned char,经过思考我认为有以下的原因:其实CPU在处理数据的时候,都有二进制表示的,无论这个数字式char还是unsigned char,它都是那个数字,只是我们的解释不同;
例如:
int a = 128;
unsigned char tempUnsignedChar = a;
char tempChar = a;
对于这两个变量tempUnsignedChar 和tempChar 来说,其实CPU在计算时存在寄存器中的值都是10000000,只是因为他们的类型不同,所以对于相同的数字产生的解释也是不同的;
那么为什么利用unsigned char来表示字节的数呢,因为它不需要涉及到符号扩充等等,这样跟接近一个数字的本质。