【CareerCup】 Arrays and Strings—Q1.1

转载请注明出处:http://blog.csdn.net/ns_code/article/details/21276577


    从今天开始要刷这个网站了,时间再紧,也要坚持下去!

    题目:

    Implement an algorithm to determine if a string has all unique characters. What if you can not use additional data structures?

    翻译:

    实现一个算法来判断一个字符串中是否没有重复的字符,只能使用基本的数据结构。

    思路:

    我们这里假设字符串为26个小写字母(当然我们可以扩充到整个ASCII码表,下面会说)。思路很多啦!可以使用桶排序的思想,分成26个桶,如果有桶中元素个数大于1,则出现重复,但实际上我们没必要对字符串进行排序,直接判断即可,因此我们可以使用哈希表,将26个小写字母映射到一个哈希表中,但因为只能使用基本的数据结构,因此我们可以使用哈希的思想,将26个小写字母映射到一个数组中(其实也还是哈希表啦,只是使最简单的直接寻址表)。

    我们开辟一个大小为26的int数组,记录26个小写字母在字符串中出现的次数,初始为0,出现一次对应位置变为1,再出现一次的话,就说明有重复了,直接返回false即可。

    这样子只需遍历一次字符串,的时间复杂度为O(n),需要额外的26个int辅助空间。

    实现代码:

/*
判断是否有重复字符
*/
bool unqString(string s)
{
	unsigned int i;
	unsigned int len = s.length();
	unsigned int arr[MAX];
	for(i=0;i<MAX;i++)
		arr[i] = 0;
	//依次对字符对应的数组位置上的值进行判断
	//0表示还没有出现该字符,1表示出现了该字符
	//如果已经为1了,再次出现该字符,则说明出现了重复
	for(i=0;i<len;i++)
	{
		unsigned int index = s[i] - 'a';
		if(arr[index] == 0)
			arr[index] = 1;
		else
			return false;
	}
	return true;
}

    由于实际上arr数字中的每个元素只可能为0或1(一旦为1时,判断再次出现,就直接返回false),因此我们可以用bool数组来代替unsigned int数组,这样可以节省内存(32位的系统中,unsigned int占4个字节,而bool占一个字节)。

    完整代码如下:

/**********************************************************
题目描述:
判断一个字符串中是否没有重复的字符,只能使用基本的数据结构
Date:2014-03-15
**********************************************************/
#define MAX 26
#include<iostream>
#include<cstring>
using namespace std;

/*
判断是否有重复字符
*/
bool unqString(string s)
{
	unsigned int i;
	unsigned int len = s.length();
	unsigned int arr[MAX];
	for(i=0;i<MAX;i++)
		arr[i] = 0;
	//依次对字符对应的数组位置上的值进行判断
	//0表示还没有出现该字符,1表示出现了该字符
	//如果已经为1了,再次出现该字符,则说明出现了重复
	for(i=0;i<len;i++)
	{
		unsigned int index = s[i] - 'a';
		if(arr[index] == 0)
			arr[index] = 1;
		else
			return false;
	}
	return true;
}

int main()
{
	string s1 = "abcdef";
	string s2 = "advcgbdfrvst";
	if(unqString(s1))
		cout<<"s1->yes"<<endl;	
	else
		cout<<"s1->no"<<endl;
	if(unqString(s2))
		cout<<"s2->yes"<<endl;	
	else
		cout<<"s2->no"<<endl;
	return 0;
}

   测试结果如下:

s1->yes
s2->no 

    如果我们将字符串中字符的范围扩大到整个ASCII编码表,需要注意:ASCII编码表的0-127是标准编码,而128-255为扩展编码(一般情况下是用不到的,编译器的实现对该部分的编码也没有任何统一的标准),如果保存为char类型,就变为负值了,即变成了-128—-1。因此,在写程序的时候,对0-127这部分字符可以直接转化为对应的整数来作为其在arr数组中的位置,而对与128-255这部分字符,则要将其转化为整数后再加256,将得到的数作为其在arr数组中的位置。

    下面再给出一种采用位操作的解决方法,位操作的目的主要是用来减少辅助空间,与哈希数组的策略相同,只是用每一位来表征相应位置字符的出现。这里有26个字符,因此我们需要26位的空间,只需开辟1个int型变量即可(32为机器下,int占用4个字节,也就是32位,大于26),同样如果是256个ASCII字符的话,可以开辟一个长度为8的int型数组(4*8*8=256)。回到本题,开辟了1个int型变量后,怎样将字符映射到对应的位上面,我们考虑使用该int变量的低26位,则字符s[i]便对应到了从低位开始数的第s[i]-'a'个位上,我们可以用1<<s[i]-'a'来表示。

    下面程序中我们尝试将256个ASCII字符映射到一个长度为8的int数组A中,稍微复杂一些,我们需要用对应的字符的ASCII码值s[i]/32即得到字符s[i]所要映射到的位所在的int变量在数组A中的下标,s[i]%32得到字符s[i]在该变量中对应的位(从低位算起)。

代码如下:

/*
采用位操作的方法判断是否有重复字符
*/
bool unqString2(string s)
{
	unsigned int i;
	unsigned int len = s.length();
	unsigned int arr[8];
	memset(arr,0,sizeof(arr));
	for(i=0;i<len;i++)
	{
		int index = (int)s[i]/32;
		int shift = (int)s[i]%32;
		if(arr[index]&(1<<shift))
			return false;
		else
			arr[index] |= (1<<shift);
	}
	return true;
}




  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值