- 博客(41)
- 收藏
- 关注
原创 知道蛋白uniprot id 进行VFDB注释
创建一个空的DNAStringSet对象来存储目标序列。# 如果找到匹配的序列,添加到目标序列集中。# 保存提取的序列到新的FASTA文件。# 读取UniProt ID文件。# 循环遍历每个目标ID。# 安装和加载必要的包。# 读取FASTA文件。
2025-01-10 14:49:52
259
原创 宏基因组分析软件
humann2_databases --download uniref uniref90_diamond $wd #功能基因diamond索引 10.3G。humann2_databases --download chocophlan full $wd #微生物物种核心基因5.37G。humann2_config --print #查看参数和数据库位置是否正确。humann2_databases #显示可用数据库。#常用修改线程数、核酸和蛋白库位置。合并质控后的双端数据。
2024-10-13 14:58:47
422
原创 screen
screen -r -S download #返回窗口。screen -S download #创建窗口。screen -ls #查看。screen -d 临时退出。ctrl +d 完全退出。
2024-09-28 21:22:52
150
原创 转录组下游分析
if (!sep="")###PCA图plotPCA(rld, intgroup="condition", ntop=nrow(counts(ddsHTSeq)))###相关性热图(100),###输出分析结果# 加change列,标记上下调基因,可根据需求设定阈值logFC = 1#筛选差异基因(基础表达量高、变化明显、p值显著)
2024-09-19 20:27:31
830
原创 rna-seq--细菌illumina测序
├── database # 数据库存放目录,包括参考基因组,注释文件,公共数据库等├── rna-seq # 项目分析目录├── data # 数据存放目录│ ├── cleandata # 过滤后的数据│ ├── trim_galore # trim_galore过滤│ └── fastp # fastp过滤│ └── rawdata # 原始数据├── Mapping # 比对目录│ ├── Hisat2 # Hisat比对。
2024-09-05 16:57:37
612
原创 slurm
SBATCH -e %x_%j.err ## 作业stderr 输出文件为: 作业名_作业id.err。#SBATCH -o %x_%j.out ## 作业stdout输出文件为: 作业名_作业id.out。#SBATCH --exclusive ## 作业使用的计算节点为独占,排除其他作业影响。#SBATCH -n 1 ## 作业申请的并行作业task数为:12。
2024-09-03 22:20:30
389
原创 linux三架马车--grep、sed、awk
一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来-w #按照单词匹配-c #统计匹配成功的行数-v #方向匹配,输出没有匹配的行-n #显示匹配成功的行所在的行号-r #查找目录-i #忽略大小写-e #指定多个匹配模式-f #从指定文件中读取要匹配的pattern【例如】less Data/example.gtf | grep -w -f file | less -S 注:file文件中包含gene和UTR。
2024-09-03 18:43:49
389
原创 重复序列分析
而RepeatModeler则可以通过从头预测的方式来鉴定基因组中未知的重复序列家族,它结合了多个工具,如RECON和RepeatScout,来构建重复序列的模型。RepeatMasker依赖于已知的重复序列数据库(如Repbase)来识别基因组中的重复序列。在基因组注释中,常用的工具包括RepeatMasker和RepeatModeler。
2024-09-01 21:52:42
308
原创 系统发育树--基因学苑
NJ邻接法:计算速度快,适合序列相似度较高的序列。对于相似度很低的序列,会出现所谓的长枝吸引现象。UPGMA:数据是连续型时,比如一个数字矩阵,差异表达数据属于这种,可以使用UPGMA法计算距离。MP最大简约法:当序列之间差异比较小,核酸序列数比较小时,可以使用最大简约法MP法,MP一般不用在远缘序列上。ML最大似然法:当序列之间亲缘关系稍远,不同谱系的进化速率较大变异时,可以采用最大似然法。
2024-08-30 20:20:19
447
原创 黑马程序员-python
i=1print(f"今天是第{i}天")print(f"给小美送{j}朵玫瑰")print("喜欢你")注:嵌套for循环通过缩进确定层次关系。
2024-07-24 19:25:35
1098
1
转载 docker pull 镜像失败报错failed to register layer: no space left on device
docker pull镜像,第一次pull镜像就提示no space left 间不足,我在/etc/docker/daemon.json文件中配置了加速器。原文链接:https://blog.csdn.net/weixin_41948075/article/details/123941754。4、编辑/etc/docker/daemon.json 添加 "root-data": “/docker/data”找到Docker Root Dir: /var/lib/docker,没修改前我的是这个地址。
2024-05-01 10:20:42
1161
原创 临床预测模型
列线图是一种建立在多因素Cox回归模型(或者其他多因素回归模型)基础上,通过带有刻度的线段按一定比例将各种预测指标列在一张平面图上,然后对每一个因素进行打分,将所有因素的得分相加得到总分,用这个总分来预测最终的结局。C-index(concordance index),也有人翻译为一致性指数,主要用于计算生存分析中的COX模型预测值与真实之间的区分度。P值小于0.05具有统计学意义,exp(coef)代表HR,大于1表示风险因素。c-index为0.69。
2024-02-27 21:37:57
426
原创 GEO数据库ID转换
作者:混迹天然 https://www.bilibili.com/read/cv14560979/ 出处:bilibili。在http://www.bio-info-trainee.com/1399.html网站获取平台探针与基因对应关系的R包。如果没有下载过这个包,就下载一下,代码如下(注意:网页里面的R包名称不是全称,要在后面加“.db”)通过上述方法我们得到了ID对应的symbol,接下来只需要将symbol列对应进矩阵就好了。
2024-02-05 22:39:56
683
2
原创 有用的命令
strsplitsymbol1 <- strsplit(symbol,split=" /// ",fixed=T)#fixed=T表示精确查找gene_symbol <- sapply(symbol1,function(x){x[1]})#提取每一个子列表中的第一个元素。
2024-01-26 22:14:57
146
1
原创 GEO :将ENTREZ_GENE_ID转换为gene symbol
【代码】GEO :将ENTREZ_GENE_ID转换为gene symbol。
2024-01-26 19:42:13
1566
1
linux中进行基因组拼接无法使用canu
2024-05-13
添加swap分区后linux变得非常卡顿,如何在linux中删除swap 分区
2024-05-13
linux内存不足怎么解决
2024-05-13
dockee linux
2024-05-13
docker 三代测序数据质控nanoplot
2024-05-12
SOAPdenovo安装使用
2024-05-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人