题目:输入一个IPv4字符串,如“1.2.3.4”,输出对应的无符号整数,如本例输出为 0x01020304。
来源:某500强企业面试题目
思路:从尾部扫描到头部,一旦发现无法转换,立即返回,减少无谓操作。
#include "stdio.h"
#include "stdlib.h"
#include "string.h"
bool ConvertIPv4ToUInt(const char *strIP, unsigned int *ip)
{
if (!strIP) {
return false;
}
int Len = strlen(strIP);
// min len is 7, e.g. 1.2.3.4; max len is 15, e.g. 123.234.121.254
if ((Len < 7) || (Len > 15)) {
return false;
}
int num[4] = { 0 }; // 4 parts of number
int partNum = 0; // 1 part of number
int base = 1; // 10^base
int dotCount = 0; // dot count
// from right to left
for (int i = Len - 1; i >= 0; --i) {
char ch = strIP[i];
if (ch == ‘.‘) {
// if the first char of last char is ".", e.g. ".1.2.3.4" or "1.2.", exit
if ((i == 0) || (i == Len - 1)){
return false;
}
dotCount++;
// if more than 3 dot found, e.g. "1.2.3.4.5", exit
if (dotCount > 3) {
return false;
}
// save partNum to num[]
num[dotCount - 1] = partNum;
partNum = 0;
base = 1;
}
else if ((ch < ‘0‘) || (ch > ‘9‘)) {
// if illeagal char inside, exit
return false;
}
else {
// handle digit char
partNum += (ch - ‘0‘) * base;
base *= 10;
if (partNum > 255) {
return false;
}
// handle first part num
if (i == 0) {
// if count of "." is not enough, exit
if (dotCount != 3) {
return false;
}
num[dotCount] = partNum;
}
}
}
// output ip
*ip = 0;
for (int i = 0; i < 4; ++i) {
*ip += num[i] << (i * 8);
}
return true;
}
int main(int argc, char* argv[])
{
char* strIP[] = {
"1",
"1.2",
"1.2.3",
"111.222.113",
"1.2.3.",
".1.2.3",
"256.1.2.3",
"1.2.3.4",
"1.2.3.4.5",
"12.234.45.6",
"12.2345.45.6",
"1.a.2.3",
"1.2.3.4 ",
"1.2. 3.4",
"1,2,3,4",
};
for (int i = 0; i < sizeof(strIP) / sizeof(char *); ++i){
unsigned int ip = 0;
if (ConvertIPv4ToUInt(strIP[i], &ip)){
printf("%s -> %08X\n", strIP[i], ip);
}
else {
printf("%s is not valid\n", strIP[i]);
}
}
getchar();
return 0;
}
输出结果为:
1 is not valid
1.2 is not valid
1.2.3 is not valid
111.222.113 is not valid
1.2.3. is not valid
.1.2.3 is not valid
256.1.2.3 is not valid
1.2.3.4 -> 01020304
1.2.3.4.5 is not valid
12.234.45.6 -> 0CEA2D06
12.2345.45.6 is not valid
1.a.2.3 is not valid
1.2.3.4 is not valid
1.2. 3.4 is not valid
1,2,3,4 is not valid
从工程化角度考虑,有几点需要注意:
1、输入的字符串是否有效?
不但要判断输入字符串是否为空,还要在处理过程中随时检查中间结果值,快速返回。
需要考虑“.”的非法位置,如开头和结尾不能有“.”。
需要考虑某段数字过长(超过255)。
需要考虑“.”的个数,必须有且只有3个。
2、快速识别错误并退出
发现有问题就快速退出,不需要进行无谓的多余计算。
3、考虑到转换失败的情况,所以返回值设定为bool,通过参数指针来返回转换结果。
如果设定UInt为返回值,则无法通过返回值判断转换是否成功。
需要的话,可以将bool的返回值改为enum,从而返回各种错误类型供调用者使用。
从编程角度考虑,有几点需要注意:
1、从后向前扫描字符串时,需要注意处理顺序。
先判断字符是否为“.”,然后判断是否为非数字,剩下的就是数字了。
这样的顺序逻辑清晰,便于在发现问题时快速退出。
2、对于类似问题,可以将测试集先列出来,写代码时候就可以有的放矢的进行容错处理了。
[笔记]一道C语言面试题:IPv4字符串转为UInt整数
时间: 07-26