PAT_1063. Set Similarity(1个case超时)


时隔3个月,重新回来开始做题,9月份要考PAT甲级.希望能有个好成绩咯

看了网上的题解,学习到求集合的交集和并集的方法,用stl中的set来解决问题.

这道题由于题目中某一个集合会出现重复的数字,但是用set中的insert插入时,重复的数字只插入一次,所以很好地避免了重复数字的计算问题.

//
//  main.cpp
//  PAT_1063. Set Similarity
//
//  Created by wjq on 17/5/18.
//  Copyright © 2017年 wjq. All rights reserved.
//

#include <iostream>
#include <map>
#include <set>
using namespace std;
int N,M,temp,quries,a,b;

set<int> s[55];
set<int>::iterator it1,it2;
double calculate()
{
    int common=0,all=0;
    for(it1=s[a-1].begin(),it2=s[b-1].begin();it1!=s[a-1].end()&&it2!=s[b-1].end();)
    {
        if(*it1==*it2)
        {
            it1++;
            it2++;
            common++;
        }
        else if(*it1<*it2)
            it1++;
        else
            it2++;
    }
    all = (int)s[a-1].size()+(int)s[b-1].size()-common;
    return (double)common/(double)all * 100;
}
int main(int argc, const char * argv[])
{
    scanf("%d",&N);
    for(int i=0;i<N;i++)
    {
        scanf("%d",&M);
        for(int j=0;j<M;j++)
        {
            scanf("%d",&temp);
            s[i].insert(temp);
        }
    }
    scanf("%d",&quries);
    for(int i=0;i<quries;i++)
    {
        scanf("%d%d",&a,&b);
        printf("%.1lf%%\n",calculate());
    }
    return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
下面是对这段代码的注释: ``` data = ["This two-wheeler is really good on slippery roads"] # 定义训练数据 sentce=["This is really good"] # 定义输入句子 from sklearn.feature_extraction.text import CountVectorizer # 导入文本特征提取库 from sklearn.feature_extraction.text import TfidfTransformer # 导入TF-IDF转换库 from sklearn.metrics.pairwise import cosine_similarity # 导入余弦相似度计算库 vectorizer = CountVectorizer() # 创建词袋模型 X_train_termcounts = vectorizer.fit_transform(data) # 对训练数据进行特征提取和向量化 tfidf_transformer = TfidfTransformer() # 创建TF-IDF转换器 X_train_tfidf = tfidf_transformer.fit_transform(X_train_termcounts) # 对训练数据进行TF-IDF转换 print ("\nTfidf of training data:", X_train_tfidf.toarray()) # 打印训练数据的TF-IDF矩阵 X_input_termcounts = vectorizer.transform(sentce) # 对输入句子进行特征提取和向量化 X_input_tfidf = tfidf_transformer.transform(X_input_termcounts) # 对输入句子进行TF-IDF转换 print ("\nTfidf of input data:", X_input_tfidf.toarray()) # 打印输入句子的TF-IDF矩阵 print("\nCosine of data:",cosine_similarity(X_train_tfidf,X_input_tfidf)) # 计算训练数据和输入句子的余弦相似度 ``` 这段代码通过使用CountVectorizer和TfidfTransformer库对文本数据进行特征提取和向量化,并使用cosine_similarity计算训练数据和输入句子的余弦相似度。输出结果是训练数据和输入句子的TF-IDF矩阵以及它们之间的余弦相似度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值