L1-8 估值一亿的AI核心代码 (正则表达式匹配) C++

原题:

以上图片来自新浪微博。

本题要求你实现一个稍微更值钱一点的 AI 英文问答程序,规则是:

无论用户说什么,首先把对方说的话在一行中原样打印出来;
消除原文中多余空格:把相邻单词间的多个空格换成 1 个空格,把行首尾的空格全部删掉,把标点符号前面的空格删掉;
把原文中所有大写英文字母变成小写,除了 I;
把原文中所有独立的 can you、could you 对应地换成 I can、I could—— 这里“独立”是指被空格或标点符号分隔开的单词;
把原文中所有独立的 I 和 me 换成 you;
把原文中所有的问号 ? 换成惊叹号 !;
在一行中输出替换后的句子作为 AI 的回答。

输入格式:

输入首先在第一行给出不超过 10 的正整数 N,随后 N 行,每行给出一句不超过 1000 个字符的、以回车结尾的用户的对话,对话为非空字符串,仅包括字母、数字、空格、可见的半角标点符号。

输出格式:

按题面要求输出,每个 AI 的回答前要加上 AI: 和一个空格。

输入样例:

6
Hello ?
 Good to chat   with you
can   you speak Chinese?
Really?
Could you show me 5
What Is this prime? I,don 't know

输出样例:

Hello ?
AI: hello!
 Good to chat   with you
AI: good to chat with you
can   you speak Chinese?
AI: I can speak chinese!
Really?
AI: really!
Could you show me 5
AI: I could show you 5
What Is this prime? I,don 't know
AI: what Is this prime! you,don't know

题解:

#include<bits/stdc++.h>
#include<regex>
using namespace std;

void operation1(string& str)
{
	// +是一次或多次,?是零次或一次,*是零次或多次
	str = regex_replace(str, regex("[ ]+"), " ");
	str = regex_replace(str, regex(" \\?"), "!");	//? 和 .是特殊字符,要加'\'
	str = regex_replace(str, regex(" \\."), ".");
    str = regex_replace(str, regex("\\?"), "!");
	str = regex_replace(str, regex(" !"), "!");
	str = regex_replace(str, regex(" ,"), ",");
	str = regex_replace(str, regex(" '"), "'");
	if (str[0] == ' ')
		str.erase(0, 1);
	if (str[str.size() - 1] == ' ')
		str.erase(str.size() - 1, 1);
}

void operation2(string& str)
{
	for (int i = 0; i < str.size(); ++i)
	{
		if (str[i] >= 'A' && str[i] <= 'Z' && str[i] != 'I')
			str[i] = str[i] + 'a' - 'A';
	}
}

void operation3(string& str)
{
	// 因为后面还有单独的I要替换成you , 所以先换成_I
	str = regex_replace(str, regex("\\bcan you\\b"), "_I can");
	str = regex_replace(str, regex("\\bcould you\\b"), "_I could");
}

void operation4(string& str)
{
	str = regex_replace(str, regex("\\bI\\b"), "you");
	str = regex_replace(str, regex("\\bme\\b"), "you");
}
void operation5(string& str)
{
	str = regex_replace(str, regex("\\b_I can\\b"), "I can");
	str = regex_replace(str, regex("\\b_I could\\b"), "I could");
}
int main()
{
	/*
		无论用户说什么,首先把对方说的话在一行中原样打印出来;
		消除原文中多余空格:把相邻单词间的多个空格换成 1 个空格,把行首尾的空格全部删掉,把标点符号前面的空格删掉;
		把原文中所有大写英文字母变成小写,除了 I;
		把原文中所有独立的 can you、could you 对应地换成 I can、I could—— 这里“独立”是指被空格或标点符号分隔开的单词;
		把原文中所有独立的 I 和 me 换成 you;
		把原文中所有的问号 ? 换成惊叹号 !;
		在一行中输出替换后的句子作为 AI 的回答。
	*/
	int n;
	cin >> n;
	getchar();
	while (n--)
	{
		string str;
		getline(cin, str);
		//getchar();
		cout << str << endl;
		operation1(str);
		operation2(str);
		operation3(str);
		operation4(str);
		operation5(str);
		cout << "AI: " << str << endl;
	}

	return 0;
}

ps:

\b 匹配这样的位置:它的前一个字符和后一个字符不全是(一个是,一个不是或不存在) \w。
注:\w 匹配字母(汉字)或数字或下划线

之前将I can先变成_I can,就是利用了\b的匹配规则,\bI\b ,无法匹配到_I can,为什么呢?原因就是,\b的前一个字符是_,后一个字符是I,都是\w范畴内,因此不符合\b的匹配规则(前后不能都是\w)

例如:

he is a boy!
需要匹配出 'is’这个单词。
我们可以使用 \bis\b 这样的表达式规则
当\b的前一个字符和前一个字符,当中有一个字符不是\w, 比如这里 is 这个单词 ‘i’ 的前面是一个空格,不是\w,而后面则是字母 ‘i’ 至此,\b 就能够匹配到以 ‘i’开头,
同样的,也能够匹配到以 ‘s’ 结尾。即能够匹配出 is 这个单词

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值