单词分割

最新推荐文章于 2024-04-07 11:33:58 发布

springontime

最新推荐文章于 2024-04-07 11:33:58 发布

阅读量2.4k

点赞数

分类专栏：数据结构文章标签：单词分割字符串字典分割

数据结构专栏收录该内容

4 篇文章 0 订阅

订阅专栏

给定一个字符串S，同时给定一个字典dict，判断字符串S是否可以被分割为一个个字典里面的单词，也就是判断字符串S是否有字典里面的单词链接而成的。

例如，给定：

s = “leetcode”,
dict = ["leet", "code"].

则结果为真，因为字符串S可以分割为leet 和code两个合法单词。

1.普通方法

bool WordBreakHelper(string& str, set<string>& dict, int nStart)
{
	if (nStart == str.length())
	{
		return true;
	}

	for (set<string>::iterator iter=dict.begin(); iter != dict.end(); iter++)
	{
		int nLen = (*iter).length();
		int nEnd = nStart + nLen;

		if (nEnd > str.length())
		{
			//单词太长直接超过了str字符串剩余部分长度。因此不可能在字符串Str中
			continue;
		}

		if(str.substr(nStart,nLen) == *iter)
		{
			if (WordBreakHelper(str, dict, nStart+nLen))
			{
				return true;//想一想为什么这么递归
			}
		}
	}
	return false;
}

时间负责度是O(n^2)。

2.动态规划的方法

用动态规划的方法来解决单词分割的关键是：

1、定义一个数组t[],t[i]==true代表字符串的前i个字符是可以用给定字典分割的。

2、数组的初始状态为t[0]==true。

bool WordBreak(string& str, set<string>& dict)
{
	bool *bAry = new bool[str.length()+1];//想一想为什么要加1
	memset(bAry,false,str.length()+1);

	bAry[0] = true;
   
	for (int i=0; i<str.length(); i++)
	{
		if (!bAry[i])
		{
			continue;
		}
		//想一想为什么要在以i代表的位置为立足点对所有可能的单词进行扫描（这很必要）
		for (set<string>::iterator iter = dict.begin(); iter!=dict.end(); iter++)
		{
			int nLen = (*iter).length();
			int nEnd = i+nLen;

			if (nEnd>str.length())
			{
				continue;
			}

			if (bAry[nEnd])//想一想什么时候发生这种情况
			{
				continue;
			}

			if (str.substr(i,nLen) == *iter)
			{
				bAry[nEnd] = true;
			}
		}
	}
	return bAry[str.length()];
}

时间复杂度为O(str.length()*dict.size())。

即使是形如如下的特殊情况,该方法仍然能很好的进行判断字符串是否能被字典分割。

输入: "programcreek", ["programcree","program","creek"].

3.更多有趣的问题

动态规划的方法虽然可以判断一个字符串S是否可以被给定的字典里的单词分割，但却不能够获悉到底是分割成了什么哪些单词。那么如何解决这个问题呢？

一个可行的办法（from jk451）如下：

将数组布尔数组bAry换做整形数组nAray。

1、将bAry[nEnd)=true替换为nAry[nEnd)=i,这意味着当你找到一个0到nEnd位置的子串可分割时，你能够得到改子串分割成的最后单词是i到nEnd位置的字母所组成的单词；

2、如果断定字符串S能够分割成为字典中的单词，那么只需要检查nAry[s.length()]里面的值，分割成的最后一个单词必然是从nAry[s.length()]到s.length()-1的位置中的字母组合成的单词，重复这个过程，可以获得其它的单词。

一点补充：当然你会发现字符串S可分割情况并不是唯一的，例如，S="nihaonihao“，字典dict=｛"ni","nihao","hao"}.此时可以分成{"nihao","nihao"}、{"ni","hao","nihao"}\.......等多种情况。

springontime

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录