187. 重复的DNA序列-滑动窗口

Problem: 187. 重复的DNA序列
每日一题。(2023年11月5日-GoodLuck)

文章目录

思路

子串问题->滑动窗口(固定长度)->解决出现次数不止大于1(在1的基础上又出现了即满足)

Code


class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        int len = s.length();
        List<String> res = new ArrayList<>();
        Map<String, Integer> map = new HashMap<>();
        // 滑动窗口
        for (int left=0;left+10<=len;left++) {
            int right = left+10;// 固定的滑动窗口
            String temp = s.substring(left,right);// 序列
            int cnt = map.getOrDefault(temp, 0);// 得到该序列出现次数
            if (cnt == 1){
                res.add(temp);// 不止一次,记录
            }
            map.put(temp, cnt + 1);
        }
        return res;
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CNN(卷积神经网络)是一种常用于图像处理和自然语言处理等领域的深度学习模型。然而,CNN也可以应用于DNA序列的输入。 DNA序列是基因组的重要组成部分,其中包含了生物个体的遗传信息。利用DNA序列可以研究基因的功能、突变、进化等方面的问题。而CNN在处理图像时利用卷积和池化层来捕捉图像中的模式和特征,同样可以被应用在分析DNA序列上。 对于DNA序列输入,可以将DNA碱基(A、T、C和G)编码成独热编码矩阵,其中每一个碱基被表示为一个向量。这样,DNA序列就可以被视为二维数据,类似于图像的二维数据。 在CNN中,可以使用卷积层来提取DNA序列中的局部特征,例如识别某一段序列中的motif(基序)。卷积层通过滑动窗口的方式在DNA序列上进行滤波操作,同时使用ReLU激活函数来引入非线性。 在卷积层之后,可以使用池化层来降低数据的维度。通过对DNA序列进行池化操作,可以减少数据的大小,并保留重要的特征。常用的池化方式包括最大池化和平均池化。 最后,使用全连接层将提取到的DNA序列特征映射到目标输出,例如分类、回归或者聚类等任务。 总之,将CNN应用于DNA序列输入可以提取DNA序列中的特征和模式,用于基因功能预测、突变分析和基因组学研究等方面。通过合理设计网络结构和参数设置,可以获得在DNA序列处理任务中较好的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值