基因相关性
描述
为了获知基因序列在功能和结构上的相似性,经常需要将几条不同序列的DNA进行比对,以判断该比对的DNA是否具有相关性。现比对两条长度相同的DNA序列。定义两条DNA序列相同位置的碱基为一个碱基对,如果一个碱基对中的两个碱基相同的话,则称为相同碱基对。接着计算相同碱基对占总碱基对数量的比例,如果该比例大于等于给定阈值时则判定该两条DNA序列是相关的,否则不相关。
输入
有三行,第一行是用来判定出两条DNA序列是否相关的阈值,随后2行是两条DNA序列(长度不大于500)。
输出
若两条DNA序列相关,则输出“yes”,否则输出“no”。
输入样例 1
0.85 ATCGCCGTAAGTAACGGTTTTAAATAGGCC ATCGCCGGAAGTAACGGTCTTAAATAGGCC
输出样例 1
yes
#include <iostream>
#include <string>
#include <iomanip>
using namespace std;
bool isRelated(double threshold, const string& dna1, const string& dna2) {
if (dna1.length() != dna2.length()) return false;
int sameBasePairs = 0;
for (size_t i = 0; i < dna1.length(); ++i) {
if (dna1[i] == dna2[i]) {
sameBasePairs++;
}
}
double ratio = static_cast<double>(sameBasePairs) / dna1.length();
return ratio >= threshold;
}
int main() {
double threshold;
string dna1, dna2;
cin >> threshold;
cin >> dna1 >> dna2;
cout << (isRelated(threshold, dna1, dna2) ? "yes" : "no") << endl;
return 0;
}