串的定义和实现
在数据结构中,串(String)是一种重要的数据类型,用于表示字符序列。串的定义和实现涵盖了字符的存储、基本操作及其在计算机科学中的应用。
一、串的定义
串是由零个或多个字符组成的有限序列,通常用一对双引号括起来。例如,"hello"和"world"都是串。在计算机中,串主要有以下几种表示方式:
- 定长顺序存储表示:使用固定长度的数组存储串。如果串的实际长度小于数组长度,则剩余部分用特定字符(通常是空字符
'\0'
)填充。 - 变长顺序存储表示:使用变长数组或动态数组存储串,允许串的长度动态变化。
- 链式存储表示:使用链表存储串中的字符,每个节点存储一个字符及其指针。
二、串的基本操作
串的基本操作包括串的创建、销毁、复制、连接、比较、子串提取、模式匹配等。
-
串的创建和销毁:
- 创建串时,需要为串分配存储空间并初始化。
- 销毁串时,需要释放串所占用的存储空间。
-
串的复制:
- 将一个串的内容复制到另一个串中。
-
串的连接:
- 将两个串连接成一个新的串。
-
串的比较:
- 比较两个串的大小,通常按字典顺序比较。
-
子串提取:
- 从一个串中提取出一个子串。
-
模式匹配:
- 在一个串中查找另一个串(模式)的出现位置。
三、串的实现
以下是C语言中串的基本操作的实现示例。
1. 串的创建和销毁
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// 创建串
char* createString(const char* str) {
char* newStr = (char*)malloc(strlen(str) + 1);
if (newStr != NULL) {
strcpy(newStr, str);
}
return newStr;
}
// 销毁串
void destroyString(char* str) {
free(str);
}
int main() {
char* str = createString("hello");
printf("String: %s\n", str);
destroyString(str);
return 0;
}
2. 串的复制
// 复制串
char* copyString(const char* str) {
char* newStr = (char*)malloc(strlen(str) + 1);
if (newStr != NULL) {
strcpy(newStr, str);
}
return newStr;
}
int main() {
char* str1 = createString("hello");
char* str2 = copyString(str1);
printf("Original String: %s\n", str1);
printf("Copied String: %s\n", str2);
destroyString(str1);
destroyString(str2);
return 0;
}
3. 串的连接
// 连接串
char* concatenateString(const char* str1, const char* str2) {
char* newStr = (char*)malloc(strlen(str1) + strlen(str2) + 1);
if (newStr != NULL) {
strcpy(newStr, str1);
strcat(newStr, str2);
}
return newStr;
}
int main() {
char* str1 = createString("hello");
char* str2 = createString("world");
char* str3 = concatenateString(str1, str2);
printf("Concatenated String: %s\n", str3);
destroyString(str1);
destroyString(str2);
destroyString(str3);
return 0;
}
4. 串的比较
// 比较串
int compareString(const char* str1, const char* str2) {
return strcmp(str1, str2);
}
int main() {
char* str1 = createString("apple");
char* str2 = createString("banana");
int result = compareString(str1, str2);
if (result < 0) {
printf("String1 is less than String2\n");
} else if (result > 0) {
printf("String1 is greater than String2\n");
} else {
printf("String1 is equal to String2\n");
}
destroyString(str1);
destroyString(str2);
return 0;
}
5. 子串提取
// 提取子串
char* substring(const char* str, int pos, int len) {
if (pos + len > strlen(str)) {
len = strlen(str) - pos;
}
char* subStr = (char*)malloc(len + 1);
if (subStr != NULL) {
strncpy(subStr, str + pos, len);
subStr[len] = '\0';
}
return subStr;
}
int main() {
char* str = createString("hello world");
char* subStr = substring(str, 6, 5);
printf("Substring: %s\n", subStr);
destroyString(str);
destroyString(subStr);
return 0;
}
6. 模式匹配
// 模式匹配
int findSubstring(const char* str, const char* pattern) {
char* pos = strstr(str, pattern);
if (pos != NULL) {
return pos - str;
}
return -1;
}
int main() {
char* str = createString("hello world");
char* pattern = createString("world");
int index = findSubstring(str, pattern);
if (index != -1) {
printf("Pattern found at index: %d\n", index);
} else {
printf("Pattern not found\n");
}
destroyString(str);
destroyString(pattern);
return 0;
}
串(String)是表示字符序列的重要数据类型。通过理解串的定义和实现,我们可以更好地进行字符串操作,包括创建、销毁、复制、连接、比较、子串提取和模式匹配等。C语言提供了丰富的库函数,可以方便地实现这些操作。在实际应用中,选择合适的串表示方式和实现方法,可以有效提高程序的性能和内存利用率。