两句话中不常见单词

//给定两个句子?A?和?B?。?(句子是一串由空格分隔的单词。每个单词仅由小写字母组成。)
//
//如果一个单词在其中一个句子中只出现一次,在另一个句子中却没有出现,那么这个单词就是不常见的。
//
//返回所有不常用单词的列表。
//
//您可以按任何顺序返回列表。
//
//来源:力扣(LeetCode)
//链接:https ://leetcode-cn.com/problems/uncommon-words-from-two-sentences
//著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
//leetcode不支持boost库
//#include<boost/algorithm/string.hpp>
//执行用时:0ms
class Solution {
public:
	vector<string> uncommonFromSentences(string A, string B) {
		vector<string> ret;
		vector<string> v(100, "");
		unordered_map<string, int> um;
		//只出现一次,合并起来统计出现次数为一次的单词即可
		A = A + ' ' + B;
		//boost::split(v,A,boost::is_any_of(' '));
		int index = 0;
		//分割单词
		for (const auto& e : A) {
			if (e == ' ') {
				++index;
			}
			else {
				v[index].push_back(e);
			}
		}
		//统计次数
		for (const auto& e : v) {
			if (e != "")
				++um[e];
			else
				break;
		}
		for (const auto& e : um) {
			if (e.second == 1)
				ret.push_back(e.first);
		}
		return ret;
	}
};
### 回答1: NLP技术通常使用词向量表示句子,并计算它们的相似度来判断两句话是否含义一样。其,词向量是将每个单词表示为向量形式,最常用的算法是Word2Vec和GloVe。通过计算两个句子的词向量之间的余弦相似度,可以衡量它们在语义上的相关性。如果相似度高于某个阈值,则可以认为两句话含义相同。 ### 回答2: 通过NLP(自然语言处理)技术判断两句话含义是否相同是基于文本相似度的计算方法。可以使用以下步骤: 1. 预处理:首先,对两句话进行预处理,包括分词、去除停用词、转换为统一的词形等。这样可以降低语义的复杂性,使得后续计算更加准确。 2. 特征表示:将处理后的两句话转化为计算机可以理解的数字表示。常用的方法有词袋模型(Bag of Words)和词嵌入(Word Embedding)。词袋模型将每个句子表示为向量,向量的每个元素表示该句子某个词的出现次数或者权重。而词嵌入则将每个句子表示为低维稠密向量,具有保留词义信息的特点。 3. 相似度计算:使用相似度计算方法来比较两个句子的特征表示,以判断它们的含义是否相同。常见的方法有余弦相似度和欧氏距离。余弦相似度度量两个向量在N维空间的夹角余弦值,值越接近1表示越相似。欧氏距离则衡量两个向量之间的距离,值越小表示越相似。 4. 阈值设置:根据具体应用需求,可以设定一个相似度阈值。如果计算出的相似度超过或达到该阈值,则判断两个句子含义相同;否则,判断它们含义不同。 需要注意的是,NLP技术在判断两个句子含义是否相同时并非完美的。语言的复杂性和语义的多样性可能导致误判。因此,对于特定场景下的判断任务,需要针对性地优化模型和调整参数,以提高判断准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值