自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 alphaFOLD3批量上传互作预测序列所需JSON文件的准备

有过预测与启动子序列互作的转录因子的想法,最近alphafold3发布,便试图使用alphaflod3看看能不能进行初步筛选。大批量预测需要提交许多序列,在网页端一个个粘贴不现实,于是alphafold sever提供了JSON文件上传接口。不过,alphafold sever虽然提供了利用JSON文件批量上传job的接口,但是却限制每天能执行的job数量为20个,在前几天还只是10个。alphafold sever网站:https://golgi.sandbox.google.com/

2024-05-21 14:31:45 477 1

原创 介绍换行符中的坑(计算机、生信小白可参考)

我手动按enter输入的换行符是正常的,当我从excel向vim复制时是错误的,难道在linux下按enter和在windows下按enter的输入是不同的?在我使用脚本循环的读取文件A的每一行并引用每一行的内容作为索引来在文件B中搜索匹配的行时,发现grep并没有输出。折腾了好久,我才突然想到,莫非是换行符出了问题,因为之前运行此脚本时,输入的文件也一定是一行一行的。对我来说实在是太坑了,由于没有背景知识,只能用错误的描述搜索出错误的答案,一直原地踏步。写没有必要的循环,同样也是,缺少知识。

2024-04-08 22:09:41 187

原创 obsidian可以帮研究生做哪些事情?

阅读与写作必须要同时进行,否则往往看了等于没没看。使用obsidian的基础功能就能允许你在同一个界面上实现浏览器+word+powerpoint,能够帮助你快速的在阅读、写作、记录中切换。快去学习如何构建适合自己的工作区吧。

2023-12-13 14:26:55 1171 1

原创 利用PlinK、EMMAX、R做全基因组关联分析与绘制曼哈顿图、qq图全流程

使用Phenotype包(R package)来进行BLUP计算得到校正后的表型值。

2023-11-15 22:23:49 998

原创 调用集群上的软件

Module中一个比较重要的文件modulefile文件,每个软件都需要有对应的modulefile文件,里面定义了该软件所需要的所有环境变量、软件说明、依赖的其他软件和库文件等,需要使用该软件时,我们用相关命令载入该modulefile文件,即可载入该软件的所有环境变量、依赖软件和库文件等。基本使用。

2023-06-14 15:49:39 125

原创 在集群上运行alphafold预测蛋白质结构

服务器数据库地址:/share/database/alphafold_data/背景:在本地运行alphafold是不可能的,因为数据库文件就3TB。还没有完全探索成功。

2023-06-10 10:17:03 140

原创 分析棉花RBOH启动子序列相似性

在热敏材料H05中,花药开裂期GHir_A07G001750,GHir_A07G005180,Ghir_D07G001790,Ghir_D08G017610,Ghir_D12G019640,Ghir_D12G029440在常温下基因表达量基本为0,高温下显著增加(from 1 to 3);然而在耐热材料84021中这些基因表达量都保持在较低水平(<0.5),H05中RBOH的表达可能导致过多活性氧积累,降低花粉活力、抑制花药开裂。(后面可以做活性氧含量测定)

2023-06-08 19:47:51 193

原创 根据一列对另一列进行筛选

grep -F -f <(cut -f 1 ROS_response_gene) 三代高温诱导表达谱.txt > EXP_ROS_res。ROS_response_gene是筛选依据列存放的文件,可以修改cut分割字段的字符来调整读取的数据。三代高温诱导表达谱.txt是被筛选的文件。

2023-06-08 19:32:23 180

原创 用conda配置Lin环境

背景:在我尝试安装一个蛋白质序列注释工具时,遇到了包冲突的问题,检索发现推荐用conda单独为该软件配置一个环境。下面介绍利用chatgpt搜索到的知识并记录我的操作。

2023-06-06 18:33:45 624 1

原创 R linux python安装包

大量的R包被CRAN收录,生物信息学软件收录在bioconductor。1.1 pacman一个包管理工具,命令一般为p_xxx,允许用户同时安装或加载多个包。其他细节见下方链接,在后面用到多个包的时候可能会用到1.3 dplyr。

2023-04-28 14:21:13 121

原创 一些奇怪的问题合集

主要涉及生信软件安装与使用

2023-04-11 22:12:27 158

转载 转载|理解不同stat_与geom_起始的作图方式

等等,有个问题,我要按照这个向量来分别染色,而事实上,这个向量长度为1,怎么办?譬如说,我们要改变x轴的颜色,或者panel的底色,这个其实与数据处理无关,这种分离就会使得我们可以如此流程化地操作作图,而不需要在考虑数据的时候还要关注到与数据无关的美学参数。有人有时候会觉得ggplot2很奇怪的地方就是为什么调整legend的时候,有时要用scale_,有时又要用theme,其实这都是对于ggplot2这个设计理念的不理解,作者的设计思路是要将数据处理与数据美学分开,数据美学与数据无关的调整分开。

2023-03-23 13:58:57 301

转载 转载|干货分享丨一文详解常规RNA-seq与3’mRNAseq优势与局限

在过去的十年中, RNA-seq已经成为全转录组范围内分析差异基因表达和mRNAs差异剪接的重要工具,被应用于研究RNA生物学的方方面面,包括基因表达、翻译(翻译组,translatome)、RNA结构(结构组,structurome)、调节性RNA、RNA表观遗传学以及RNA动力学等。 随着下一代测序技术的革新,RNA-seq技术也得到了不断发展,其应用领域也得到了不断拓展,例如空间转录学(spatialomics)等。加上近年来长读长测序和直接RNA-seq(direct RNA-seq)技术的应用以及

2023-03-21 19:24:11 487

原创 Linux文本处理

背景:在分析生物信息数据时,往往会产生很多文本文件,如gene ID。Linux自带了处理文本数据大的程序包。本文主要介绍设计文本编辑、筛选、排序等功能的程序包。

2023-03-14 19:59:27 45

原创 使用HMMERsearch搜索某物种中含有某蛋白质结构域的全部蛋白

基础蛋白质数据库使用知识

2023-03-13 09:49:37 4097

原创 R语言基本操作

R语言下进行文件系统的操作,主要涉及新建、设置工作目录

2023-03-12 11:46:48 636

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除