自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 贪心算法思想例题

随后,在第 4 天(股票价格 = 3)的时候买入,在第 5 天(股票价格 = 6)的时候卖出, 这笔交易所能获得利润 = 6 - 3 = 3。在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4。在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4。虽然你有两块小饼干,由于他们的尺寸都是1,你只能让胃口值是1的孩子满足。

2023-09-20 16:41:20 130

原创 Leetcode day 2

你可以假设数组是非空的,并且给定的数组总是存在多数元素。,返回其中的多数元素。多数元素是指在数组中出现次数。删除重复出现的元素,使得出现次数超过两次的元素。向右轮转 1 步: [99,-1,-100,3]向右轮转 2 步: [3,99,-1,-100]并在使用 O(1) 额外空间的条件下完成。不要使用额外的数组空间,你必须在。,返回删除后数组的新长度。,将数组中的元素向右轮转。

2023-09-20 09:31:04 138

原创 MULTI-LEVEL PROTEIN STRUCTURE PRE-TRAINING WITH PROMPT LEARNING

通过这个框架,我们提出了三种互补的预训练结构来获取多层次的结构信息,并将它们灵活地组合起来用于各种下游任务。功能预测和蛋白质工程的实验结果表明,与传统的 PTPM 相比,所提出的方法可以产生令人满意的改进。蛋白质结构有四个不同的层次,第一级是由氨基酸组成的蛋白质序列,第二级是指局部折叠结构,第三季描述自然折叠的三维结构,第四级是由多个氨基酸组成的蛋白质聚体。这些结果证明,并非预训练中的所有结构信息都对下游任务有益,并且通过即时调整自适应地组合获取的信息可以带来更好的性能。

2023-07-20 17:21:35 271

原创 提示学习(Prompt-learning)

该阶段需要大量任务相关的训练数据,通过特征工程和算法,比较有代表的算法是朴素贝叶斯Naïve Bayes、支持向量机SVM、逻辑回归LR等;模板(Template)的功能是在原有输入文本上增加提示语句,从而将原任务转化为MLM 任务,可以分为离散型和连续型两种。模板由不同字段构成,可任意组合。每个字段中的关键字定义了数据文本或者提示文本,即 input_ids,属性可定义该字段是否可截断,以及对应的 position_ids,token_type_ids 等。什么是MLM 任务?

2023-06-23 10:10:39 5465

原创 NLP领域中的各种注意力机制

Seq2Seq(Sequenceto Sequence)模型:根据给定的序列,通过特定的生成方法生成另一个序列的方法,同时这两个序列可以不等长。最经典的Encoder-Decoder模型​编辑语义编码c:通常指的是编码器对输入序列进行编码得到的固定长度的向量表示。这个向量包含了输入序列的语义信息,可以看做是对整个输入序列的抽象表示,用于为解码器生成输出序列提供信息。

2023-05-12 09:36:27 763

原创 sAMPpred-GAT:通过图形注意力网络预测抗菌肽并预测肽结构

关键词:Graph Attention network;AMPs;

2023-03-15 20:07:52 886 2

翻译 AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架

机器学习,尤其是深度学习 (DL) 在基于质谱 (MS) 的蛋白质组学中越来越重要。AlphaPeptDeep,这是一个构建在PyTorch DL库基础上的模块化Python框架,它可以学习和预测多肽的属性。AlphaPeptDeep以通用的方式表示翻译后修饰,即使只有化学组成是已知的。用于预测保留时间、碰撞截面和碎片强度的AlphaPeptDeep模型至少与现有工具相当。其他基于序列的特性也可以通过AlphaPeptDeep进行预测,正如通过改进与数据无关的获取的HLA多肽识别模型所展示的那样。

2023-01-13 14:44:33 742

原创 CPC客户端补正申请书提交

cpc补正申请可能遇到的问题

2022-12-16 19:34:00 216

翻译 IDNA-ABF: DNA甲基化可解释预测的多尺度深度生物语言学习模型

在本研究中,提出了IDNA-ABF,这是一种多尺度深度学习生物语言学习模型,能够仅基于基因组序列对DNA甲基化进行解释性预测。基准比较表明,IDNA-ABF在不同甲基化预测方面优于最先进的方法,重要的是,展示了深度语言学习在从背景基因组中获取顺序和功能语义信息方面的威力。此外,通过可解释的分析机制,我们从很好地解释了模型所学东西,帮助我们建立了从发现重要序列决定因素到深入分析其生物功能的映射。

2022-11-03 16:40:09 958

翻译 PHIAF:使用基于 GAN 的数据增强和序列的特征融合预测噬菌体-宿主相互作用

噬菌体疗法已成为抗生素治疗细菌性疾病最有希望的替代方案之一,鉴定噬菌体-宿主相互作用(PHI)有助于了解噬菌体感染细菌的可能机制,从而指导噬菌体疗法的发展。在本文中,我们提出了一种 PHI 预测方法,该方法基于生成对抗网络 (GAN) 的数据增强和基于序列的特征融合 (PHIAF)。

2022-09-22 16:24:23 901

原创 cpc客户端紫屏问题解决方法

cpc客户端

2022-08-16 16:12:39 876

原创 使用word2vec预训练模型提取DNA/RNA序列特征向量

使用word2vec预训练模型提取DNA/RNA序列特征向量

2022-08-06 10:48:25 1538 19

翻译 使用深度融合识别 RNA 5-甲基胞嘧啶位点的改进残差网络

5-甲基胞嘧啶 (m5C) 是一种重要的转录后修饰。随着技术的发展,它广泛存在于各种RNA中。大量研究表明,m5C在生物体的各种活动中起着至关重要的作用,如tRNA识别、RNA结构稳定、RNA代谢等。传统的湿法生物鉴定既费钱又费时。因此,计算模型通常用于识别 m5C 位点。...............

2022-08-03 21:56:36 550 6

原创 Swin-Transformer

transfomer应用到图像领域主要有针对上述两个问题,本文提出了一种包含滑窗操作,具有层级设计的Swin Transformer。其中滑窗操作包括不重叠的local window,和重叠的cross-window。将注意力计算限制在一个窗口中,一方面能引入CNN卷积操作的局部性,另一方面能节省计算量。...

2022-04-28 16:09:11 909

翻译 ORI-Deep:通过混合特征和长短期记忆网络来提高预测复制站点来源的准确性

Conclusion我们提出了一种基于深度学习的方法,用于从真核 DNA 序列中预测 ORI。我们从 DeOri 收集了一个基准数据集,用于我们提出的模型,以识别基因组序列中的 ORI。我们使用了 DNA 序列的基于频率和位置的特征,并使用统计矩进行降维以形成固定大小的特征向量。...

2022-03-20 16:12:45 311

翻译 论文解读:CRBPDL:使用集成神经网络方法识别 circRNA-RBP 相互作用位点

CRBPDL: Identification of circRNA-RBPinteraction sites using an ensemble neural network approach期刊:PLOS COMPUTATIONAL BIOLOGY中科院分区:二区代码和数据集链接:https://github.com/nmt315320/ CRBPDL.git摘要circRNAs是通过反向剪接机制产生的具有特殊环状结构的非编码RNA,环状 RNA 可以直接与 RNA 结合蛋白 (R

2022-02-06 16:05:37 1208

翻译 论文解读:iDHS-Deep: an integrated tool for predicting DNaseI hypersensitive sites by deep neural networ

iDHS-Deep:一种通过深度神经网络预测DNase I超敏感位点的集成工具论文期刊:Briefings in Bioinformaticsweb-server:http://lin-group.cn/server/iDHS- Deep/主要工作:1.开发了一个基于深度学习的算法(CNN+LSTM)来识别未知序列区域是否潜在的DHS位点2.基于五折交叉验证和独立测试数据验证了模型的优越性3.搭建了一个网页服务器检测小鼠基因组中不同组织和发育阶段的DHSs4.讨论了DH.

2021-10-28 15:32:03 256 1

翻译 论文解读:Deep-Kcr: accurate detection of lysine crotonylation sites using deep learning method

Deep-Kcr:使用深度学习方法准确检测赖氨酸巴豆酰化位点doi: 10.1093/bib/bbaa255代码链接:https://github.com/linDing-group/Deep-Kcr数据集:

2021-09-19 16:27:48 797

翻译 论文解读:利用堆叠框架计算预测和解释来自多个真核生物的细胞特异性复制起点

数据集收集四种生物类别数据(H. sapiens M. musculus D. melanogasterand A.thaliana)特征工程使用12种不同的DNA序列编码方案,基于四种类型的核酸(‘A’, ‘C’, ‘T’, ‘G’)的序列,将他们转换为固定长度的数字特征编码。同时我们将这12种编码方案按照基于成分,基于位置和基于物理化学性质划分为三组。基于成分的特征编码方案(CKSNAP , Kme...

2021-08-25 16:16:12 816

翻译 基于深度表征学习特征的抗癌肽预测

Anticancer peptides prediction with deep representation learning features中科院分区:二区(Briefings in Bioinformatics)代码链接:数据集:https://webs.iiitd.edu.in/raghava/anticp2/研究意义:抗癌肽是治疗人类常见癌症最有前途的药物之一。传统治疗癌症的主要方法是放疗,化疗和靶向治疗,这些治疗方法的目的是杀死癌细胞,但同时也损害正常细胞,这些方法都.

2021-08-04 19:11:25 1358

原创 学习笔记(TensorFlow)

什么是张量?张量(Tensor):多维数组(列表) 阶:表示为张量的维数0阶:标量exp :s=1 2 31阶:向量 exp: v=[1,2,3]2阶:矩阵 exp: m=[[1,2,3],[4,5,6]] (注:通过数括号的方式来计算张量的维度)张量可以表示0阶到n阶的数组如何创建一个张量?创建一个张量 tf.constant(张量内容,dtype=数据类型(可选))import tensorflow as tfa=tf.constant(...

2021-07-09 16:38:48 103

翻译 Deep6mA:探索不同物种DNA N6甲基腺嘌呤位点相似模式的深度学习框架

论文解读Deep6mA: A deep learning framework forexploring similarpatterns in DNA N6-methyladenine sites across different speciesDeep6mA:探索不同物种DNA N6甲基腺嘌呤位点相似模式的深度学习框架摘要N6-甲基腺嘌呤(6mA)是一种重要的DNA修饰方式,在基因组水平上准确识别6 mA位点对于理解6 mA的生物学功能至关重要。然而,现有的探测6 mA位点的实验

2021-07-06 18:05:36 1148

翻译 iRNA5hmC:使用机器学习识别RNA5 -羟甲基胞嘧啶修饰的第一个预测因子

iRNA5hmC:使用机器学习识别RNA5 -羟甲基胞嘧啶修饰的第一个预测因子摘要RNA 5-羟甲基胞嘧啶(5hmC)修饰在一系列生物过程中起着重要作用。研究其在转录组中的分布对揭示5hmC的生物学功能至关重要。基于测序的技术允许高通量识别5hmC;然而,它们是劳动密集型的,耗时的,以及昂贵的。因此,迫切需要开发更有效和高效的计算方法,至少可以补充高通量技术。在这项研究中,我们开发了iRNA5hmC,一种利用机器学习识别RNA5hmC位点的计算预测协议。在此预测中,我们引入了一种基于序列的特征算法,

2021-06-01 09:31:27 689

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除