- 博客(24)
- 收藏
- 关注
原创 蛋白分析工具和数据库
其中,UniProtKB/Swiss-Prot是手工注释的高质量蛋白质数据库,提供了丰富的注释信息;其中,UniProtKB(UniProt Knowledgebase)是最核心的组成部分,包含了经过注释和分类的蛋白质序列和功能信息。它提供了详细的蛋白质注释,包括序列特征、结构域、功能、亚细胞定位、酶活性等。此外,使用UniProt进行亚细胞定位预测的方法很简单,除了直接通过关键词(如蛋白id、基因名等)查询蛋白信息之外,也可以使用蛋白序列,通过BLAST(如下)的方式找到对应蛋白的信息。
2025-06-13 09:07:47
183
原创 随机森林原理
对于一个输入样本,每棵树会有分类/预测结果,随机森林模型将集成所有分类结果(回归预测结果进行平均),将投票次数最多的类别指定为最终的结果输出(回归预测后,统计所有决策树对同一样本的预测结果,所有的结果的平均值作为最终预测值)。与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的特征。体现在数据集样本的随机抽样选择和待选特征的随机抽样选择,使得每一棵树的样本、特征都是不同的。数据集样本的随机抽样选择。
2025-06-13 09:07:38
179
原创 Zero-Shot突变预测VenusREM的安装和使用
通过改造野生型蛋白质,以提升其催化活性、稳定性、结合亲和力等特性,从而满足工业和科研的需求。近年来,展现出了相较于传统方法(如定向进化和理性设计)更优越的效果和更低的成本。在突变效应预测中,预训练深度学习模型的关键在于精准理解蛋白质。本研究提出了一种,用于综合分析蛋白质的本征属性(通过序列和局部结构相互作用)以及进化属性(通过检索得到的同源序列)。研究人员在一个公开基准数据集 ProteinGym 上,使用来自 217 个实验的逾 200 万个突变体对该模型进行了评估,验证了其领先的性能。
2025-06-11 17:53:05
1579
原创 服务器数据迁移
本文提供了一个稳健的服务器迁移方案,将用户文件、Conda环境和配置文件分类处理。关键步骤包括:1)使用rsync同步用户项目文件(.zshrc/.oh-my-zsh等)和模型缓存;2)通过conda-pack打包旧服务器环境,在新服务器解压后执行conda-unpack修复路径;3)安装相同版本Miniconda并配置国内镜像。方案强调测试验证(--dry-run)和权限修正(chown),确保迁移后环境完整可用。特别提醒conda-unpack步骤对解决路径引用问题的必要性。
2025-05-27 09:45:27
1407
原创 AI设计蛋白质评估流程-COMPSS安装和使用教程
近年来,基于语言模型或逆向折叠算法进行蛋白序列设计可谓如火如荼。然而,预测评估生成的蛋白质是否还会折叠和发挥功能仍具有挑战性。本文尝试了20种不同的计算指标,以评估三种模型(祖先序列重建、生成对抗网络和蛋白质语言模型)生成的酶蛋白序列质量。我们重点关注两个酶家族,表达并纯化了500多个天然和生成序列,生成序列与最相似的天然序列具有70-90%一致性。对预测体外酶活性的计算指标进行基准测试。经过三轮实验,我们提出一种计算过滤标准COMPSS,将实验成功率提高了 50-150%。
2025-05-13 16:32:59
1458
2
原创 ThermoMPNN/ThermoMPNN-D 的安装及使用教程
ProteinMPNN使用了整个PDB中的19700个蛋白簇进行训练,目标是根据给定的蛋白质骨架预测天然序列,它通过预测每个位置的天然残基的概率来实现这一点。这些预测是基于从PDB中的天然蛋白质中学习到的结构模式。
2025-04-15 17:56:39
785
原创 酶动力学预测工具CataPro安装教程
在此,研究人员基于蛋白质语言模型、小分子语言模型和分子指纹,提出了一种名为 CataPro 的新酶动力学参数预测算法。该研究从 BRENDA 和 SABIO-RK 数据库中收集了最新的转化率(kcat)、迈克尔常数(Km)和催化效率(kcat/Km)数据。根据 0.4 的蛋白质序列相似性对这些数据进行聚类,我们得到了相应的 10 倍交叉验证数据集。CataPro 在这些无偏 10 倍交叉验证数据集上进行了训练,在预测 kcat、Km 和 kcat/Km 方面的性能优于之前的预测器。1、创建并激活虚拟环境。
2025-04-02 20:48:03
1060
3
原创 Linux修改默认shell为zsh
加入之前输入过这个指令 ssh node01,那么当你输入 ssh no 的时候,终端会提示灰色,只需要按 →(右箭头)或者。Oh My Zsh 是一个超好用的 Zsh 配置框架,让终端更智能、自动补全超强、还有主题美化 ✨。而conda是有效命令,会是绿色。其中合法命令是绿色,错误命令是红色,路径、参数、变量会以不同的颜色区分。,就像你在用 fish shell 或输入法那样的“灰色提示”。支持更复杂的参数结构提示(比自带的 zsh 更强)(语法高亮):为你在终端中输入的命令加上。
2025-03-29 18:28:00
1266
2
原创 ESMFold 安装教程
运行esmfold需要安装openfold 1.0.0,如果直接使用pip install openfold或者使用github作者给予的命令,会安装成2.0.0,会造成程序的错误,因此主要解决的一个问题就是需要手动安装1.0.0版本的openfold,过程中遇到的其他问题也会一一解决。对轴向注意力计算进行分块处理,从而降低内存占用。选择以普通的形式进行安装,这样 openfold 的包会被复制到 conda 环境的 site-packages 目录中,而不是仅仅建立一个链接,其他用户无需访问源代码目录。
2025-03-18 15:06:44
1150
6
原创 Docker 镜像传输
可以通过任何文件传输方式(如 scp、rsync 等)将 .tar 文件传输到目标服务器。这将把 hello-world:latest 镜像保存为名为 hello-world.tar 的 tar 文件;其中,user@target_server:/path/to/destination 为目标服务器的实际路径;这会将 tar 文件中的 Docker 镜像加载到 Docker 中。目的:已下载的 Docker 镜像从一个机器传输到另一个机器。
2024-12-02 10:48:00
382
原创 Docker卸载
6、删除Docker配置文件(可选)2、查找已安装的docker软件包。4、删除Docker相关文件和目录。3、移除Docker软件包。5、删除Docker用户组。1、停止Docker服务。
2024-12-01 11:23:19
978
原创 Linux安装NVIDIA 容器工具包(NVIDIA Container Toolkit)
该错误通常发生在使用 Docker 容器时,特别是涉及 GPU 加速的任务。这个错误提示说明当前系统没有正确安装或配置 NVIDIA 容器工具包(NVIDIA Container Toolkit),该工具包是用于支持 Docker 容器中使用 NVIDIA GPU 的必需工具。
2024-11-29 20:09:01
1992
原创 Docker问题:docker: Error response from daemon
出现 docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": read tcp 12.12.12.3:54552->54.236.113.205:443: read: connection reset by peer 错误,通常是因为 Docker 无法通过代理连接到 Docker Hub 来拉取镜像。这通常是由于网络访问问题或代理配置不当。3、保存并退出文件;
2024-11-29 10:47:35
7548
1
原创 Docker常用命令
这些是一些常用的Docker命令;其中,表示镜像id, 表示镜像名称,表示容器id,使用过程中,需要将其替换成具体的镜像或者容器值;可以帮助你管理容器和镜像。
2024-11-28 22:05:49
152
原创 将Docker加入系统的Module管理
是一种用于在集群环境中动态加载和卸载环境模块的工具。它通常用于加载不同版本的软件环境和设置必要的路径和环境变量。如果 Docker 已经安装,并且你的系统支持使用 module 工具来管理它,你可以将 Docker 配置为一个模块,并通过 module load docker 来加载 Docker 环境。
2024-11-28 14:24:14
479
原创 Linux安装Docker
Docker 是一种开源的容器化平台,用于开发、运维和部署应用程序。Docker 允许你将应用程序及其依赖项封装到一个标准化的容器中,并能确保在任何环境下都能一致地运行。容器是一种轻量级、可移植的虚拟化技术,它比传统的虚拟机更高效。
2024-11-27 22:36:29
1642
原创 Linux服务器将普通用户添加到sudoers组
在 Rocky Linux 8 中,通常将用户添加到 wheel 组,以允许其使用 sudo 权限。可以执行以下命令将 username 用户添加到 wheel 组(这里的username替换成需要修改权限的用户名),-aG 选项表示将用户 username 添加到 wheel 组,并保留该用户的其他组信息。注意:只有root用户才有权限将普通用户添加到 sudoers文件中并授予其管理员权限,所以事先必须知道root用户的密码,本文以Rocky Linux 8为例。
2024-11-27 21:52:32
1837
原创 git clone下来的文件不完整(仓库中部分文件是用Git LFS上传的)
Git 克隆操作已经成功完成了普通对象的下载。Git LFS 管理的大文件可能尚未下载,需要通过命令下载完整的 LFS 文件。确保本地正确安装了 Git LFS,并在克隆后运行相应的命令来拉取大文件。
2024-10-08 13:24:51
3680
2
原创 VSCode连接远程服务器时打开TensorBoard报错:The package TensorBoard is required to launch a TensorBoard session.
最终经过查询终于找到了出现这个问题的原因:是VSCode中错误的使用了Linux系统的Python3.6解释器,而不是我项目中conda虚拟环境的python3.10解释器,所以只需要把当前的python解释器切换成你想要的python解释器即可;我也曾尝试过用管理员权限去执行上述指令,但是还是有问题,无法正常打开tensorboard的窗口;3、最后就可以在VSCode中正常启动tensorboard了,快去试试吧,希望能解决你的问题!2、 选择我们该项目的虚拟环境中python的解释器即可;
2024-08-09 11:36:53
864
2
原创 Linux 常用命令集合
linux查看指定文件(filename)最后几行数据;linux查看一个文件有多少行;文件中最长的那一行是多少个字符;4、统计指定文件中的单词数;
2024-08-06 21:21:09
176
1
原创 使用WSL2安装Ubuntu 24.04和蛋白隧道动力学分析工具Caverdock v1.2
4、从Caverdock的官网下载Apptainer/Singularity Image 的 CaverDock软件,但是点击download之后是一个乱码的sif文件;9、输入 caverdock --help 发现缺少一些依赖的包,逐一对其进行安装(安装过程发现有些特定版本的依赖项找不到,但是换源之后找到了,体现了换源的重要性);这些隧道是蛋白质内部的路径,通常允许小分子或者离子通过,从而参与和调控生物分子的功能;3、安装Apptainer容器,它是一个相对较新的容器软件(类似docker);
2024-08-06 20:39:21
2047
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人