图像相似度(信息学奥赛一本通-T1123)

【题目描述】

给出两幅相同大小的黑白图像(用0-1矩阵)表示,求它们的相似度。说明:若两幅图像在相同位置上的像素点颜色相同,则称它们在该位置具有相同的像素点。两幅图像的相似度定义为相同像素点数占总像素点数的百分比。

【输入】

第一行包含两个整数m和n,表示图像的行数和列数,中间用单个空格隔开。1≤m≤100, 1≤n≤100。

之后m行,每行n个整数0或1,表示第一幅黑白图像上各像素点的颜色。相邻两个数之间用单个空格隔开。

之后m行,每行n个整数0或1,表示第二幅黑白图像上各像素点的颜色。相邻两个数之间用单个空格隔开。

【输出】

一个实数,表示相似度(以百分比的形式给出),精确到小数点后两位。

【输入样例】

3 3
1 0 1
0 0 1
1 1 0
1 1 0
0 0 1
0 0 1

【输出样例】

44.44

【源程序】

#include<iostream>
#include<cstdio>
using namespace std;
int main() 
{
    int m,n;
    int a[101][101],b[101][101];
    int sum=0;
    int i,j;
    double semblance;
    
    cin>>m>>n;//输入图像列数、行数
    
    for(i=1;i<=m;i++)//输入第一个图像
        for(j=1;j<=n;j++)
            cin>>a[i][j];
    
    for(i=1;i<=m;i++)
        for(j=1;j<=n;j++)
        {
            cin>>b[i][j];//输入第二个图像
            if(a[i][j]==b[i][j])//与第一个图像比较,若像素点颜色相同,计数器+1
                sum++;
        }
    
    semblance=sum*1.0/(n*m)*100;//相似度计算
    printf("%.2lf\n",semblance);
    
    return 0;
}

 

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TF-IDF算法是一种常用的文本相似度计算方法,可以用于计算网站页面的相似度分布。下面是一个使用Python实现TF-IDF算法计算网站页面相似度分布的示例代码: ```python import requests from bs4 import BeautifulSoup import re import numpy as np from sklearn.feature_extraction.text import TfidfVectorizer # 获取网页内容 def get_page_content(url): try: response = requests.get(url) html = response.text return html except: return "" # 解析网页内容并提取文本 def parse_html(html): soup = BeautifulSoup(html, 'html.parser') for script in soup(["script", "style"]): script.extract() text = soup.get_text() lines = (line.strip() for line in text.splitlines()) chunks = (phrase.strip() for line in lines for phrase in line.split(" ")) text = '\n'.join(chunk for chunk in chunks if chunk) return text # 计算相似度矩阵 def calculate_similarity_matrix(content_list): vectorizer = TfidfVectorizer(min_df=1, stop_words="english") tfidf = vectorizer.fit_transform(content_list) similarity_matrix = (tfidf * tfidf.T).toarray() return similarity_matrix # 打印相似度分布 def print_similarity_distribution(similarity_matrix): similarity_distribution = np.triu(similarity_matrix, k=1).flatten() similarity_distribution = similarity_distribution[similarity_distribution > 0] print("Mean similarity:", np.mean(similarity_distribution)) print("Median similarity:", np.median(similarity_distribution)) print("Max similarity:", np.max(similarity_distribution)) print("Min similarity:", np.min(similarity_distribution)) print("Standard deviation of similarity:", np.std(similarity_distribution)) # 示例代码 if __name__ == "__main__": urls = ["https://www.baidu.com/", "https://www.zhihu.com/", "https://www.google.com/"] content_list = [] for url in urls: html = get_page_content(url) content = parse_html(html) content_list.append(content) similarity_matrix = calculate_similarity_matrix(content_list) print_similarity_distribution(similarity_matrix) ``` 该示例代码获取了百度、知乎和谷歌三个网站的页面内容,并使用TF-IDF算法计算它们之间的相似度分布。可以根据需要修改示例代码中的网站列表,以计算其他网站之间的相似度分布。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值