数据结构与算法题目集7-44——基于词频的文件相似度

该博客介绍了如何使用C++解决基于词频计算文件相似度的问题,涉及字符串处理和set集合应用。通过getchar()逐字符读取文件,将单词存储在set中,然后比较两个文件的set集合交集来评估相似度。
摘要由CSDN通过智能技术生成

我的数据结构与算法题目集代码仓:https://github.com/617076674/Data-structure-and-algorithm-topic-set

原题链接:https://pintia.cn/problem-sets/15/problems/891

题目描述:

知识点:字符串、set集合的应用

思路:用getchar()函数一个一个字符地读取并分隔

将每个文件读取到的单词都放进一个set集合里,查询时遍历其中一个set集合的所有元素,在另一个set集合里查找,如果找到,则相同字符数common加1,总字符数为两个set集合之和减去common。

时间复杂度与空间复杂度和输入的数据有关。

C++代码:

#include<iostream>
#include<string>
#include<set>

using namespace std;

set<string> sets[100];

int main() {
	int N;
	scanf("%d", &N);
	getchar();
	for
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值