每日练习1-替换字符串中的空格

题目

        输入一个字符串,将该字符串中的空格用“%20”替代,其他保持不变,返回该字符串。例如输入字符串“This is YoungMay!”,应该返回的字符串是“This%20is%20YoungMay!”。

解决思路:

(1)每个空格用“%20”替代,相当于每次替换都会增加两个字符。所以返回的新字符串的长度应该是“原字符串的长度+ 2*原字符串中的空格数”;

(2)我们从后向前遍历字符串,依次替换。遇到不是空格的字符,直接将其放到新字符串的当前最后一个位置,然后位置前移;若当前指向的是空格,从当前新字符串的最后一个位置开始,连续赋值‘0’‘2’‘%’(这里是从后向前遍历,要注意赋值顺序);

(3)重复(2)步骤,直至原字符串遍历结束。

注意:

    (2)中的遍历不能从前向后遍历,因为我们并没有开辟新的空间去存新字符串,而是在原来的空间上进行拷贝赋值等动作,(同时(2)的正常进行的前提就是原字符串所在的空间要足够容纳新的字符串)若是从前向后遍历,当遇到空格时,我们连续赋值三个字符,就会遗失原字符串的字符,当然,你也可以保存下来,然后利用该种方法。


实现代码:

#include <stdio.h>
#include <assert.h>
#include <string.h>

void replace(char* p, int size)
{
	//先统计空格数
	int i = 0;
	int j = 0;
	int len = 0;
	int count = 0;
	assert(p != NULL);
	for (i = 0; i < size; i++)
	{
		if (p[i] == ' ')
			count++;
	}
	//所以返回的新字符串的大小为
	len = size + 2 * count;
	//倒着开始生成新字符串
	i = size;
	j = len;
	while (i >= 0 && i != j)//结束条件就是两下标都走到字符串的开始位置,表示新字符串生成完毕
	{
		if (p[i] == ' ')
		{
			p[j--] = '0';
			p[j--] = '2';
			p[j--] = '%';
			i--;
		}
		else
		{
			p[j--] = p[i--];
		}
	}
	return;
}

int main()
{
	char p[50] = "we are happy.";
	printf("原字符串是:%s\n", p);
	int size = strlen(p);
	replace(p, size);
	printf("替换后的字符串是:%s\n", p);
	system("pause");
	return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 文本清洗是指对文本数据进行处理,去除无用信息,使其更加规范化和易于处理。在Java,可以使用正则表达式来进行文本清洗。 正则表达式是一种用来描述字符串模式的语言,可以用来匹配、查找和替换文本的特定模式。在Java,可以使用java.util.regex包的类来操作正则表达式。 常见的文本清洗操作包括去除空格、标点符号、HTML标签等。例如,可以使用正则表达式来去除字符串的所有空格String str = "hello world"; str = str.replaceAll("\\s+", ""); 这里的\\s表示空格字符,+表示匹配一个或多个空格字符。使用replaceAll()方法可以将所有匹配的空格字符替换为空字符串。 除了去除空格,还可以使用正则表达式来去除标点符号: String str = "hello, world!"; str = str.replaceAll("[\\p{Punct}&&[^']]+", ""); 这里的\\p{Punct}表示所有标点符号,&&[^']表示除了单引号之外的所有标点符号。使用replaceAll()方法可以将所有匹配的标点符号替换为空字符串。 另外,如果需要去除HTML标签,可以使用以下代码: String str = "<p>hello, <b>world</b>!</p>"; str = str.replaceAll("<[^>]+>", ""); 这里的<[^>]+>表示匹配所有HTML标签,使用replaceAll()方法可以将所有匹配的HTML标签替换为空字符串。 总之,使用正则表达式可以方便地进行文本清洗,使得文本数据更加规范化和易于处理。 ### 回答2: 随着大量数据的产生和积累,文本清洗成为数据处理的一个重要步骤。在文本处理,可能会遇到一些格式上的问题,比如HTML标签、非法字符、标点符号等等,这些问题会影响数据的分析和使用。正则表达式是一种强大的文本匹配和处理工具,可以帮助我们快速而准确地筛选和清洗文本数据。 在Java,使用正则表达式进行文本清洗需要使用java.util.regex包的类和方法。其最常用的类是Pattern和Matcher。Pattern表示正则表达式,而Matcher则是用来匹配Pattern和输入字符串的工具。 在使用正则表达式进行文本清洗时,首先需要定义正则表达式的模式。比如,假设我们需要清洗一段HTML代码,把其的标签去掉,可以定义如下正则表达式: String pattern = "<[^>]*>"; 这个正则表达式的含义是匹配尖括号包含的任意字符,其^表示非,即除了尖括号以外的其他字符。[^>]*表示匹配任意个数的非尖括号字符。在这种情况下,这个正则表达式将会匹配所有的HTML标签,然后我们就可以使用Matcher将其替换为空字符串,例如: String html = "<html><body><p>Hello World!</p></body></html>"; String pattern = "<[^>]*>"; String cleanedHtml = html.replaceAll(pattern, ""); 这样就可以把原始HTML代码的所有标签去掉,得到干净的文本数据。 除了HTML标签以外,还可能会遇到其他需要清洗的问题。比如,有些文本可能包含了“垃圾”字符,如控制字符、特殊符号等等,这些字符可能无法正确地存储、处理或显示。在这种情况下,可以使用正则表达式来删除这些字符,例如: String text = "Hello\u0009World!\u000d\u000a"; String pattern = "[\u0000-\u001f\u007f]"; String cleanedText = text.replaceAll(pattern, ""); 这个正则表达式的含义是匹配ASCII码表的控制字符和删除字符(\u0000-\u001f和\u007f),然后将其替换为空字符串。这样就可以去掉文本的垃圾字符,得到干净的文本数据。 总之,正则表达式是一种强大的文本匹配和处理工具,可以帮助我们快速准确地清洗文本数据。在使用正则表达式时,需要对要处理的文本有一定的了解,并根据需要定义合适的正则表达式模式。正则表达式虽然强大,但也容易出错,因此需要仔细检查和调试。同时也需要注意正则表达式的效率问题,避免因过度使用正则表达式而导致程序性能下降。 ### 回答3: 文本清洗是计算机处理自然语言和文本数据的一项重要任务。其,正则表达式是一种强大的工具,常用于文本清洗去除不必要的字符和格式,从而增加文本数据的可读性、可解析性和可分析性。在Java编程语言,使用正则表达式进行文本清洗也是十分常见的,下面将介绍练习Java字符串之正则表达式之文本清洗的方法和技巧。 首先,需要了解正则表达式的基本语法和符号。Java的正则表达式可以使用java.util.regex包的类来实现,例如Pattern和Matcher。在使用正则表达式进行文本清洗时,需要注意以下几点: 1. 使用String类的replaceAll方法可以方便地进行字符串替换和清洗。其,第一个参数是正则表达式,第二个参数是替换后的字符串。例如: String str = "Hello, World!"; str = str.replaceAll("[, !]", ""); // 输出结果:HelloWorld 2. 匹配多种模式可以使用“|”符号。例如,想要匹配“a”或“b”或“c”,可以写成: String pattern = "a|b|c"; 3. 需要匹配特殊字符时需要使用转义符“\”。例如,匹配句子的引号可以写成: String pattern = "\".*?\""; 4. 使用“.*?”表示非贪婪匹配,尽可能少地匹配字符。例如,要匹配行末的换行符可以写成: String pattern = "\r?\n.*?"; 5. 使用“^”和“$”表示字符串的开头和结尾。例如,如果要匹配全是字母的行可以写成: String pattern = "^[a-zA-Z]+$"; 综上所述,正则表达式是Java字符串操作的重要工具,可以通过其强大的匹配功能实现文本清洗和格式化。在使用过程需要熟悉其基本语法和符号,并结合具体的需求进行灵活运用。随着深度学习和自然语言处理的快速发展,正则表达式在文本清洗的应用也将愈加广泛和重要。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值