Rosalind Java| Counting Point Mutations

Rosalind编程问题之计数核酸序列突变数。

Counting Point Mutations

Problem
Given two strings s and t of equal length, the Hamming distance between s and t, denoted dH(s,t), is the number of corresponding symbols that differ in s and t. See Figure 2.

Figure 2
Figure 2. The Hamming distance between these two strings is 7. Mismatched symbols are colored red.

Given: Two DNA strings s and t of equal length (not exceeding 1 kbp).
Sample input

//序列1
CGGCCCTTCCTCGTGCGCGCCGGTGAGCAACTGCGTTAACCGCCCCCGGGTTCCGCTAAGTACGGGCGACGAAGGCGGCAGTTGAGCATGATCCATTATTTATGTGACATTAACCATGGAGGAGCATCATATGAGCCGAGTCTTTTTGTAATTCCAACGATTCGGCAGGCACCAAGGCTTCAATGGGTTTCGTATGATGTAATTGCTCGTCACCAGCAGCCCCACCAGAGTCTTTCTAAATATCTTTTTTTTGTTCAAAGATTGGGAGCTCGTGGGCAGACTGAGTGGGTCTGTAGGGAGCTGATGGGTAGAAATCAAGGCAGATTTGCTGGAAGTATCCCAGTTCACACCTTATCGTTAATTTCCTAGTAAGTTTCACACGCTTCTATTAAAGTACCTCGTGAACAGATGGCTCGTTGACGGCTTGATTAATCTTAGGGGCCGGATATTAAATGTTGACCATCTTTCATAAACCCCCCGCTGGATTAATCTCCTGGTGACTCTGCTGGCATCTCCATCCGTCTGATTTGTTGACTACCCCTTCTGATGTAGGATCCCGTGGGAGATATGGTACGCCCGCACGGTCGAGGACGAATCGTTCACGTATAGAGCTCACGGCGCCTATGGGCAGTGGCCCCTCCACTAGCTTCGGTAGGTAGTACGTCCGGTCTATGAATCGAAAGGTAAAGTCGATCCCTCGGGCTAAGGTTAGAAGTAATTCAGTGCGATTCGGCTCGCGACCTATCCATGATCGTCGCGCTTCTTGAGGGTCGCGAATAATAACGATGTTACCAAAATCCCTGTTGTTCCGTAATTTAAATAGATTACCTGGCATCGGGGTATCGAGATTGGAGCCATTCCTCACGAGCCGTCCACGGGATTCGTATCAGGTGGGCTGGAATTATCGTAACATGAAAGTATGCAGACCTCTCCAATTCATCCGAGCGATGTGATCAGTAACAACTGTTCTGCTCCCA
//序列2
CGCCCCCACCCTCCCCACGAGTGAGTGCGCTTACTTGGACAGTCCCAGGCCAATCATAAGTTGGGAACAGGCGGGCATCGTTTCCAAATTTCCTCTAGTCGCGATGAGATGAAGGATCGCGGGTTATCGATTACTCCGTTGGACTGTGCCAAGCCTCTGTGTAAGCGCACGGTGTGCCTCATACAGTTCCTGTTTGTGCAAACACCTCTCCCGTAAGAGAAACAGGAGAGGCTTGTGGAACCACCTCTACCTGCGTGAATAATGTCCACCATCTCAATGCCTAAAAGGGCCTGTTGGTCGCTGATTTACAGCGATTAATACACGTCTGGAGCAAGAATCCAGGTGTTCACCTGACGGCAGAGTATCACATTAGCTAGCAATACTCCTATTAACCTTCAGCGCGTATGCTATTCTCATTAGGCGCTTCAGTGGAATAATCCCTCGGATGGTCGATGTTGACAACACTCCACATCCCGCAAAATAGTTTGACCTCCTAATAACTCGGACCTCCCCTTGTTCAGGTATGTGCCCTGGCGATTGCGTCTGGTGTGGCATCCGAGAAATCAAAGGGTTATGATGGTTCTTTGATTACTGAACGGAACTACATATAGGTGTCGGGGGCTATCGTCTGTTCCCAGACCCCTACTGACAGGAGGGCGGTCTCTTTGACTATGCTTGCGGATATAAAATGGATCTCAGGGAGAAGCGCGCGATCAAATTGGTAGAAACTCTGTTAGCTGATGCTTAACGAGACTTGTACTACTAGTGTGTCCCAGATGACATCGATCATTGCTAGATCGCCCTTCCAGCCCAGGTGCAACCGATGACTAGGCATCTGGGTTACGAGACTTAAGCCATGCTTCCGGTCCATTTAAGGGTTTACCCATTATCTGTTCTGCTTGTAACTGCCCTTAGACGGATGTTGACCTTTGATACTCTTACCACCACGCTTACCAGTAATAGATGTTCTCTGCGAT

Return: The Hamming distance dH(s,t).

511

题目引入了一个名词——汉明距离。汉明距离是以理查德·卫斯里·汉明的名字命名的,表示两个相同长度字符对应位不同的数量,通常以d(x,y)表示两个字x,y之间的汉明距离。而针对本题而言,两个序列的汉明距离就是对应位置碱基不同的位置个数。因此我们计算两个核苷酸数量相等的序列中,相同位置处碱基不同的位置个数。

整体思路比较简单:逐一比对两个序列中相同位置的字符,如若不等则累计一个突变数mutation,最终输出计数总数。

import java.util.Scanner;

public class Counting_Point_Mutations {
    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        System.out.println("请输入核酸序列1:");
        String line1 = sc.nextLine();//将序列1存储到字符串类型对象line1中。

        Scanner cs = new Scanner(System.in);
        System.out.println("请输入核酸序列2:");
        String line2 = cs.nextLine();//将序列2存储到字符串类型对象line2中。
        System.out.println(countMut(line1,line2));

    }
	
	//定义计数突变数的方法:输入数据为两个字符串类型的核酸序列,返回整数型突变数。
    public static int countMut(String line1, String line2){
        int mutation = 0;
        for (int n =0; n< line1.length();n++){
            if (line1.charAt(n)!=line2.charAt(n)){//遍历文本字符并逐一比较。
                mutation++;
            }
        }
        return mutation;
    }
}

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值