c++数据结构:字符串

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中中表示文本的数据类型。

字符串在存储上类似字符数组,它每一位单个元素都是能提取的,字符串的零位是它的长度,如s[0]=10,这提供给我们很多方便,例如高精度运算时每一位都能转化为数字存入数组。

  • 空格串:由一个或多个空格组成的串

串的顺序存储表示:

const int Max_length = 100;//最长串长
class string
{
private:
	char String[Max_length];//定义最大串长
	int size;//数据数量
};

串的堆分配方式:

class string
{
private:
	char* ch;
	int size;//串长度
public:
	string()//默认初始化为空
	{
		ch = nullptr;
		size = 0;
	}
};

以下主要分析在堆分配下的功能:

串的复制:

void string::copy_string(char* p)//复制串
{
	if (!ch)delete ch;//非空,清除数据
	int i = 0;
	for (; p[i]; ++i);//获取p的长度
	ch = new char[i];
	for (size=0
		; size < i;size++)
	{
		ch[size] = p[size];//复制内容
	}
}

串的长度

int string::length()//串的长度
{
	return size;
}

 获取子串位置:

(暴力求解)

int string::SubString(string p)
{
	int i = 0, j = 0;
	while (ch[i] != '\0' && p[j] != '\0')
	{
		if (ch[i] == p[j])
		{
			i++;
			j++;
		}
		else
		{
			i = i - j + 1;
			j = 0;
		}
	}
	if (p[j] == '\0') return (i - j);     //主串中存在该模式返回下标号 
	else return -1;     //主串中不存在该模式 
}

KMP(求子串位置)

KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息

可以观看以下视频:(比较清晰)

【搬运】油管阿三哥讲KMP查找算法,中英文字幕,人工翻译,简单易懂_哔哩哔哩_bilibili

以下内容根据上面的进行总结:

重点是:求最长的前后缀

next数组的求法:

int* build_Next(char* p)//构建next表
{
	int m = strlen(p);//获取字符串长度
	int j = 0;
	int* next = new int[m];//构建next表
	int t = next[0] = -1;//模式串指针
	while (j < m - 1)
	{
		if (0 > t || p[j] == p[t])//匹配
		{
			j++; t++;
            next[j] =t;
			//next[j] =(p[j]!=p[t]?t:next[t]);
		}
		else
		{
			t = next[t];
		}
		return next;
	}
}

kmp算法:

int kmp(char* p, char* t)//KMP算法
{
	int* next = build_Next(t);//构建next表
	int n = strlen(p), i = 0;//文本串指针
	int m = strlen(t), j = 0;//模式串指针
	while (i < n && j < m)
	{
		if (j==-1 || p[i] == t[j])//匹配的话
		{
			i++; j++;
		}
		else
		{
			j = next[j];//模式串右移
		}
	}
	delete[]next;
	if (j == m)
	{
		return i - j;
	}
	return -1;
}

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据结构字符串C是指在C语言中对字符串进行操作和处理的一种数据结构。它包括对字符串的拼接、删除、截取、转换、匹配、替换等常用功能的实现。该数据结构还涉及单字符串匹配和多模式匹配算法的详细讲解。另外,C中的字符(char)实际上是以ASCII码值存储的。字符常量使用单引号表示,如'a'、'A',对应的ASCII码值分别为97、65。字符常量与字符串常量(双引号括起来的)是有区别的,字符常量是单个字符,而字符串常量可以包含多个字符。C语言提供了一些特殊字符(如'\n'、'\r'、'\t')来表示换行、回车、制表等功能。引用的中的C模板实现的数据结构字符串类也提供了对字符串的各种操作,其中的匹配算法使用了基于KMP的快速匹配算法。这个字符串类具有良好的编码风格和详细的算法注释。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [C++数据结构字符串](https://blog.csdn.net/suren_jun/article/details/127561801)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [C++数据结构字符串及KMP匹配算法](https://download.csdn.net/download/linxdef/9387482)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [C++字符串](https://blog.csdn.net/u014042772/article/details/125807000)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值