去掉字符串里的空格

最新推荐文章于 2024-08-13 17:58:45 发布

BaldwinMe

最新推荐文章于 2024-08-13 17:58:45 发布

阅读量746

点赞数

分类专栏： C++ win32 文章标签：算法 string 测试微软 .net 优化

C++ 同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

win32

5 篇文章 0 订阅

订阅专栏

如何去掉字符串中的空格（转）

1. 写在前面的

事情的起因是这样的，我要处理一段这样的程序，用户可以以任意的形式输入11位数字+空格的形式，然后我要把他分成434的格式。

然后想到的办法是：去掉所有空格，然后按照规则划分成数组，然后再输出。

那么怎么样去掉空格，常规的方法这么几个：

A. String.Replace()

B. String.Split(new char[]{‘ ’},StringSplitOptions.RemoveEmptyEntries);

C. System.Text.Regex()来进行正则替换

D. 有人提出用StringBuilder，但是我们永远不要忘记StringBuilder的临界值，在小数据的情况下，使用StringBuilder反而是得不偿失的。

2. 性能大比拼

毋容置疑，使用正则一定是最慢的办法，再次不做演示。

首先贴出测试代码：

static void Main(string[] args)

{

Stopwatch sw = new Stopwatch();

string sTemp = "11 1241 111 11 ";

string sTest = String.Empty;

for (int i = 0; i < 1000; i++)

{

sTest += sTemp;

}

sw.Start();

for (int i = 0; i < 1000; i++)

{

sTest.Replace(" ", "");

}

sw.Stop();

Console.Write("使用Replace所消耗的时间：");

Console.WriteLine(sw.ElapsedMilliseconds.ToString());

sw.Reset();

sw.Start();

for (int i = 0; i < 1000; i++)

{

sTest.Split(new char[] { ' ' }, StringSplitOptions.RemoveEmptyEntries);

}

sw.Stop();

Console.Write("使用Split所消耗的时间：");

Console.WriteLine(sw.ElapsedMilliseconds.ToString());

}

接下来是测试结果：

正如我们意料中的一样，Replace的效率一定要比Split高的，猜测的理由其实很简单，Replace的作用就是用来替换字符，而Split是用来拆分，这里属于典型的方法乱用。

扩展阅读：《.NET,你忘记了么？（八）—— 从dynamic到特性误用》

3. 谈谈String.Split()

我没有办法看到String.Replace()源码，那么在这里就只说说String.Split()。

大致代码可以通过Reflector看到，这里只粘贴出核心的代码：

public string[] Split(string[] separator, int count, StringSplitOptions options)

{

bool flag = options == StringSplitOptions.RemoveEmptyEntries;

int[] sepList = new int[this.Length];

int[] lengthList = new int[this.Length];

int numReplaces = this.MakeSeparatorList(separator, ref sepList, ref lengthList);

if ((numReplaces == 0) || (count == 1))

{

return new string[] { this };

}

if (flag)

{

return this.InternalSplitOmitEmptyEntries(sepList, lengthList, numReplaces, count);

}

return this.InternalSplitKeepEmptyEntries(sepList, lengthList, numReplaces, count);

}

首先我们来关注下MakeSeparatorList方法，在这个方法里，微软通过遍历分隔符数组和字符串，两层for循环，得到了字符串中，每个分隔符所在的索引。接下来就是根据索引来直接分割字符串了，无需赘言。

4. 算法分析

从上面的代码，我们可以很轻松地看出，算法的时间复杂度是O(M*N)，那么我们有没有更优的算法来实现他呢？

首先，我们要看到算法的时间复杂度瓶颈在于MakeSeparatorList方法，那就来优化这个方法，实现如下：

private static bool[] MakeSeparatorList(char[] separatorArray)

{

bool[] charArray = new bool[255];

for (int i = 0; i < separatorArray.Length; i++)

{

charArray[separatorArray[i]] = true;

}

return charArray;

}

那么之后我们就可以在遍历字符串的时候，直接通过每个字符的ASC2码来得到这个字符是否是分隔符了。

5. 算法优劣

既然这样的算法时间复杂度小，那为什么微软不采用这样的算法呢？

时间复杂度并不能决定算法的优劣，我们所谓的指数型，对数型还是ON级，都是针对当数据量大幅度增长时。但是在此问题中，分隔符只有1个，我们却需要为这一个字符去声明一个大小为255的bool型数组，这在空间复杂度上是很得不偿失的。

那么该算法适合什么？该算法适合当分隔符具有多个，字符串也很长时，那么O(N)就远远小于O(M*N)了。

6. 写在最后

好久没有写东西了，以至于写写自己已经不知道自己在写什么了。

东西写得乱七八糟，算了算了…….

只是警醒自己，也警醒各位，.NET Framework为我们提供了大量的类库方法支持，但是在用一个方法之前，我们是否该把这个方法搞清楚，这个方法是否是最优的方法，我们是该自己重新写一个方法，还是……

追本溯源，这才是程序员该做的。

1. char a[] = "this is a dog.";

2. char *toks = " ";

3. char * tok = strtok( a, toks );

4. while( tok )

5. {

6. if( tok == a )

7. strcpy( a, tok );

8. else

9. strcat( a, tok );

10. tok = strtok( NULL, toks );

11. }

#include <stdio.h>

int main()

{

char str[255] , ret[255];

char *p = str;

int i = 0;

printf( "Please input the string:\n" );

gets(str);

while( *p )

{

if( *p != ' ' )//注意这里是空格，百度显示不出来。

{

ret[i] = *p;

i++;

}

p++;

}

ret[i] = 0;

printf( "The result is:\n" );

printf( "%s" , ret );

printf( "\n" );

return 0;

}

如果遇到空格后后边的字符都退位的话可以这样：
find(char   *s,int   l=sizeof(*s))
{int   i,j;
  for(i=0;i <l;i++)
  {
      if(strcmp(s+i, '\0 '));   for(j=i;j <l-i;j++)
                                                  {s+j=s+j+1;}
  }

find(char   *s,int   l)
{
  int   i,j,cl,flag=0;
  for(i=0;i <l;i++)
  {
      if((strcmp(*(s+i),0x20)==0))         //这里判断字符串里有否空格。
      {
        cl=l-i;                                                 //计算剩余多少个字符（以当前i开始计算）
        for(j=i;j <cl;j++)
        {*(s+j)=*(s+j+1);}                           //这里是当有空格的时候，后边的每个字符向前进一步
        *(s+l-flag)= '\0 ';                             //这里为填充尾（可以相对之前修改的尾）
        flag++;                                                 //这里为上一句工作
      }
  }
}

main()
{char   hehe[]={ "wo   shi   wu   di   de "},*p;
  p=hehe;
  printf(hehe);
  printf( "\n ");
  find(p,sizeof(hehe));             //这里调用函数，其中sizeof是计算字符串长度
  printf(hehe);
}