生信
文章平均质量分 62
云仄
Do not let your dream be dreams!
展开
-
使用muscle多序列比对
muscle多序列比对原创 2022-08-24 10:25:25 · 1880 阅读 · 1 评论 -
miRanda-通过circRNA的sequence来预测靶向的miRNA
miRanda-通过circRNA的sequence来预测靶向的miRNA原创 2022-08-24 10:00:57 · 3108 阅读 · 0 评论 -
根据NCBI序列号批量下载fasta文件
NCBI提取fasta转载 2022-08-19 16:30:22 · 1594 阅读 · 0 评论 -
基因、DNA、碱基、染色体之间的关系是什么?
生物小白搞生信,,需要了解 的生物知识,转载于知乎DNA就是脱氧核糖核酸(英语:Deoxyribonucleic acid,缩写为DNA)由含氮的碱基+脱氧核糖+磷酸组成。因为核糖和磷酸都一样而碱基又可以分为四种(腺嘌呤A,鸟嘌呤G,胸腺嘧啶T,胞嘧啶C),所以脱氧核糖核苷酸就可以分为四种(按照碱基的不同来分)同时在书写过程中可以用这碱基的简写代替。RNA就是核糖核酸(RiboNuc...转载 2019-12-14 12:30:13 · 11678 阅读 · 0 评论 -
生信投文章经验积累总结
Bioinformatics是作为生物信息学最重要的专门期刊了。2012年度IF=5.468 另外还有Briefings in Bioinformatics,这个杂志每年的发稿量少,最近几年IF波动很大,第一年24+,后来到9+,2012年度IF=5.202。 稍次一点的杂志,如BMC Bioinformatics,也是生物信息学的专刊。2012年度IF=3.447 对于计算向的生物信息学,...原创 2019-12-09 15:18:39 · 4788 阅读 · 0 评论 -
通过bed文件获取fasta序列
一、BED 文件格式BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。必须包含的3列:1.chrom, 染色体名字(e.g. chr3, chrY)2.chromStart, 目标区段在染色体起始位置,染色体第一个碱基的位置是03.chromEnd, 目标区段在染色体结束位...转载 2018-11-24 11:23:52 · 6009 阅读 · 4 评论 -
特征选择---SelectKBest
看论文偶然看到这个方法,就了解一下。from sklearn.feature_selection import SelectKBesthttp://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.SelectKBest.html#sklearn.feature_selection.SelectKBest...转载 2019-07-16 09:53:04 · 32799 阅读 · 7 评论 -
SMOTE算法
SMOTE(Synthetic Minority Oversampling Technique),合成少数类过采样技术.它是基于随机过采样算法的一种改进方案,由于随机过采样采取简单复制样本的策略来增加少数类样本,这样容易产生模型过拟合的问题,即使得模型学习到的信息过于特别(Specific)而不够泛化(General),SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添...转载 2019-07-16 09:57:58 · 65992 阅读 · 2 评论 -
DNA序列转换为RNA序列
1、Python文件DNA转RNA#!/usr/bin/python 2 #-*- coding:utf-8 -*- 3 "将DNA序列转换为RNA序列,即将T转换为U即可,利用字符串的replace方法" 5 f=open('./test.txt', 'r') 6 line=f.read() 7 dna2rnaline=line.replace('T', 'U') 8 f.clo...原创 2019-07-24 14:09:38 · 8368 阅读 · 0 评论