wenbin66666-CSDN博客

原创 alphaFOLD3批量上传互作预测序列所需JSON文件的准备

有过预测与启动子序列互作的转录因子的想法，最近alphafold3发布，便试图使用alphaflod3看看能不能进行初步筛选。大批量预测需要提交许多序列，在网页端一个个粘贴不现实，于是alphafold sever提供了JSON文件上传接口。不过，alphafold sever虽然提供了利用JSON文件批量上传job的接口，但是却限制每天能执行的job数量为20个，在前几天还只是10个。alphafold sever网站：https://golgi.sandbox.google.com/

2024-05-21 14:31:45 2333 4

原创介绍换行符中的坑（计算机、生信小白可参考）

我手动按enter输入的换行符是正常的，当我从excel向vim复制时是错误的，难道在linux下按enter和在windows下按enter的输入是不同的？在我使用脚本循环的读取文件A的每一行并引用每一行的内容作为索引来在文件B中搜索匹配的行时，发现grep并没有输出。折腾了好久，我才突然想到，莫非是换行符出了问题，因为之前运行此脚本时，输入的文件也一定是一行一行的。对我来说实在是太坑了，由于没有背景知识，只能用错误的描述搜索出错误的答案，一直原地踏步。写没有必要的循环，同样也是，缺少知识。

2024-04-08 22:09:41 247

原创 obsidian可以帮研究生做哪些事情？

阅读与写作必须要同时进行，否则往往看了等于没没看。使用obsidian的基础功能就能允许你在同一个界面上实现浏览器+word+powerpoint，能够帮助你快速的在阅读、写作、记录中切换。快去学习如何构建适合自己的工作区吧。

2023-12-13 14:26:55 1652 1

原创利用PlinK、EMMAX、R做全基因组关联分析与绘制曼哈顿图、qq图全流程

使用Phenotype包（R package）来进行BLUP计算得到校正后的表型值。

2023-11-15 22:23:49 2334 1

原创调用集群上的软件

Module中一个比较重要的文件modulefile文件，每个软件都需要有对应的modulefile文件，里面定义了该软件所需要的所有环境变量、软件说明、依赖的其他软件和库文件等，需要使用该软件时，我们用相关命令载入该modulefile文件，即可载入该软件的所有环境变量、依赖软件和库文件等。基本使用。

2023-06-14 15:49:39 288

原创在集群上运行alphafold预测蛋白质结构

服务器数据库地址：/share/database/alphafold_data/背景：在本地运行alphafold是不可能的，因为数据库文件就3TB。还没有完全探索成功。

2023-06-10 10:17:03 235

原创分析棉花RBOH启动子序列相似性

在热敏材料H05中，花药开裂期GHir_A07G001750,GHir_A07G005180,Ghir_D07G001790,Ghir_D08G017610,Ghir_D12G019640,Ghir_D12G029440在常温下基因表达量基本为0，高温下显著增加（from 1 to 3）；然而在耐热材料84021中这些基因表达量都保持在较低水平（<0.5）,H05中RBOH的表达可能导致过多活性氧积累，降低花粉活力、抑制花药开裂。（后面可以做活性氧含量测定）

2023-06-08 19:47:51 313

原创根据一列对另一列进行筛选

grep -F -f <(cut -f 1 ROS_response_gene) 三代高温诱导表达谱.txt > EXP_ROS_res。ROS_response_gene是筛选依据列存放的文件，可以修改cut分割字段的字符来调整读取的数据。三代高温诱导表达谱.txt是被筛选的文件。

2023-06-08 19:32:23 238

原创用conda配置Lin环境

背景：在我尝试安装一个蛋白质序列注释工具时，遇到了包冲突的问题，检索发现推荐用conda单独为该软件配置一个环境。下面介绍利用chatgpt搜索到的知识并记录我的操作。

2023-06-06 18:33:45 701 1

原创 R linux python安装包

大量的R包被CRAN收录，生物信息学软件收录在bioconductor。1.1 pacman一个包管理工具，命令一般为p_xxx，允许用户同时安装或加载多个包。其他细节见下方链接，在后面用到多个包的时候可能会用到1.3 dplyr。

2023-04-28 14:21:13 179

原创一些奇怪的问题合集

主要涉及生信软件安装与使用

2023-04-11 22:12:27 278

转载转载|理解不同stat_与geom_起始的作图方式

等等，有个问题，我要按照这个向量来分别染色，而事实上，这个向量长度为1，怎么办？譬如说，我们要改变x轴的颜色，或者panel的底色，这个其实与数据处理无关，这种分离就会使得我们可以如此流程化地操作作图，而不需要在考虑数据的时候还要关注到与数据无关的美学参数。有人有时候会觉得ggplot2很奇怪的地方就是为什么调整legend的时候，有时要用scale_，有时又要用theme，其实这都是对于ggplot2这个设计理念的不理解，作者的设计思路是要将数据处理与数据美学分开，数据美学与数据无关的调整分开。

2023-03-23 13:58:57 493

转载转载|干货分享丨一文详解常规RNA-seq与3’mRNAseq优势与局限

在过去的十年中， RNA-seq已经成为全转录组范围内分析差异基因表达和mRNAs差异剪接的重要工具，被应用于研究RNA生物学的方方面面，包括基因表达、翻译（翻译组，translatome）、RNA结构（结构组，structurome）、调节性RNA、RNA表观遗传学以及RNA动力学等。随着下一代测序技术的革新，RNA-seq技术也得到了不断发展，其应用领域也得到了不断拓展，例如空间转录学（spatialomics）等。加上近年来长读长测序和直接RNA-seq（direct RNA-seq）技术的应用以及

2023-03-21 19:24:11 849