自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Rys_Ben_Blogs

学习笔记等。

  • 博客(61)
  • 收藏
  • 关注

原创 NGS胚系短变异检测_数据分析

NGS变异检测中的数据处理。

2024-03-23 22:57:13 630

原创 JavaScript_02_notes

是按照顺序反复多次执行一段程序,通常会有明确的终止条件。和。使用这两个特性,能够更清晰、高效、方便地实现迭代。指任何实现的对象。每个迭代器都会关联一个,而迭代器会暴露该对象的 API。迭代器无须了解该对象的结构,只需要知道如何取得连续的值。结构拥有在一个函数块内暂停和恢复代码执行的能力。其形式是一个函数,在函数名称前面加一个星号( *)表示。调用生成器函数会产生一个,它一开始处于暂停执行(suspended)的状态。调用next()方法会让生成器开始或恢复执行。yield。

2024-02-18 10:39:51 514

原创 RNA-seq数据分析_未完成

RNA-seq分析流程

2024-02-06 10:55:16 324

原创 使用Pipeline和ColumnTransformer提升机器学习代码质量

机器学习项目中最冗长的步骤通常是数据清洗和预处理,库中的Pipeline和 and通过一次封装替代逐步运行transformation步骤,从而减少冗余代码量。

2024-01-09 22:49:30 508

翻译 sklearn_交叉验证_scoring

sklearn中交叉验证的使用方法。

2024-01-08 23:01:29 106

原创 深度学习中氨基酸序列的编码方法

随着AI算法创新和算力提升,叠加生物(组学)数据(指数级)增长,深度学习在生信领域中的应用也愈加广泛。具体到蛋白领域,深度学习已经在三级结构预测、新抗原预测等场景中取得了当前最优的预测性能。在实际应用时,为了将氨基酸序列输入深度学习模型,需要通过编码方法将其转化为数字表示。本文介绍了几种常见的编码方法。

2024-01-02 08:01:22 1572

原创 lftp学习笔记

lftp的基本使用

2023-12-28 23:00:22 1018

原创 notes_质谱&蛋白组学数据分析基础知识

质谱组学,尤其质谱蛋白组学的基础概念。

2023-11-09 08:06:50 1893 1

原创 MaxQuant的安装和使用(linux OR windows)

MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。

2023-10-30 11:27:24 3221

原创 生信数据下载汇总

①下载网址:https://ftp.ncbi.nlm.nih.gov/blast/db/预格式化数据库,如n[tr]*tar.gz等,推荐优先使用。FASTA序列,可以从格式化数据库提取。

2023-10-26 10:11:41 374

原创 notes_NLP

自然语言处理的一些记录。

2023-10-21 22:40:38 779 1

原创 notes_jupyter_notebook

jupyter notebook的一些使用记录

2023-10-17 10:15:09 223

原创 【work around】可执行文件(编译时)glibc版本小于运行环境(运行时)glibc版本

可执行文件中GLIBC版本大于运行环境的work around。

2023-10-16 14:17:38 593

原创 生物标志物发现中的无偏数据分析策略

精准医疗中生物标志物发现的数据分析策略。

2023-10-14 17:20:00 2450

原创 MySQL常用操作

MySQL的常见操作

2023-09-20 22:53:11 322

原创 note_前端框架Vue的安装和简单入门(Windows 11)

(1) 下载安装node.js和npm(2) 使用npm下载安装vue。

2023-09-03 15:43:41 1343

原创 d2l_notes_ch3-ch4

线性神经网络&多层感知机

2023-06-24 21:54:52 391

原创 d2l_notes_ch1-ch2

引言&预备知识

2023-06-17 22:43:32 408

原创 VSC学习笔记

VSC简要使用指南

2023-02-05 20:19:39 3535

原创 机器学习概览_学习笔记

机器学习笔记

2022-10-03 20:13:11 686

原创 Django学习笔记_2_MTV

Django基本概念

2022-10-01 17:51:46 610

原创 JavaScript_01_notes

JavaScript学习笔记

2022-08-20 23:04:28 379

原创 Django学习笔记_1_Django安装和项目启动

Django笔记

2022-08-20 15:35:57 258

原创 机器学习应用于组学数据时常见的坑

机器学习应用在组学数据时常见的问题和解决方法

2022-07-16 21:34:56 675

原创 Nextflow的基本概念和使用方法

基本概念channel用于连接process。process构成流程的基本单元,可以包括directives, inputs, outputs, when clause, script等五部分,语法如下:process < name > { [ directives ] input: <input qualifier> <input name> [from <source channel>] [attributes]

2022-04-30 20:13:45 4068

原创 Gitlab简介

使用gitlab常用命令https://www.cnblogs.com/ray-mmss/p/10861703.htmlgitlab之一: gitlab安装配置使用https://www.cnblogs.com/yitianyouyitian/p/9214940.htmlGitlab磁盘空间问题 针对Prometheushttps://blog.csdn.net/johnchensz/article/details/106414335Monitoring GitLab with Prometh

2021-07-12 23:10:47 153

原创 [摘录] 使用linux搭建流程的一些技术细节

set 命令参数作用set -e若指令传回值不等于0,则立即退出shell。set -o pipelineset -x执行指令后,会先显示该指令及所其参数。set -u当执行时使用到未定义变量,则显示错误信息。# 写法1set -euxo pipefail# 写法2bash -euxo pipefail script.shLinux set命令Bash 脚本 set 命令教程Bash 错误处理如果脚本里面有运行失败的命令(返回值非0),

2021-06-28 21:40:50 76

原创 C语言学习笔记--基本概念

1. 安装安装:集成开发环境(IDE):集成开发的各个部分(编辑、编译、链接、执行、调试等)的软件包。2. Hello world示例代码1:pun.c/* * Name: pun.c * Author: K. N. King, Rys */# include <stdio.h> /* header: <stdio.h> */int main (void) /*int: 函数将返回一个整数值; void: 函数没有参数*/{ printf(

2021-06-12 10:50:22 202

原创 html 入门

Header 1A paragraph.<html> <head> </head> <body> </body></html>head标签描述style1) 定义样式信息. 2) type=“text/css” 定义 style 元素的内容,body标签描述...

2021-05-24 23:00:38 120

原创 生信数据常见文件格式

生信文件格式。

2021-05-22 15:28:15 200

原创 计算机基础知识

概览1. CPUCPU的重要组件及其功能如下。逻辑算数单元(ALU):寄存器:控制器:多核CPU:包含2个以上CPU(cores)的单个芯片,也称为Sockets。Hyper-Threading:2. Memory3. I/OA1. 分布式文件系统(DFS)NFS...

2021-05-22 09:05:03 106

原创 Torrent_Suite_Software

1. Plugin System1.1 入门插件是通用分析流程的扩展,表现为在流程不同环节执行的python模块。1.1.1 快速开始'''vi Myplugin/MyPlugin.py # belowzip -r –exclude=*.git* mp.zip MyPluginupload, run'''import subprocessfrom ion.plugin import *class MyPlugin(IonPlugin):# Must inherit from

2021-04-12 23:11:16 943 1

原创 软件工程入门笔记

文章目录软件生命周期模型瀑布模型(快速)原型模型增量模型迭代模型敏捷开发思想敏捷软件开发宣言(2001)敏捷 VS. 瀑布敏捷实践学习笔记摘录于:宝玉.《软件工程之美》软件开发过程(软件项目周期)可以分为需求定义与分析、设计、实现、测试、交付和维护。基于此衍生出最基础的过程模型——瀑布模型。但是由于周期较长等缺点,又在瀑布模型基础上提出了V模型、原型设计、增量模型、螺旋模型等,已改善前者的一些缺陷。到90年代,各种轻量级开发方法不断被提出,又形成了敏捷开发。软件工程 = 过程 + 方法 + 工具

2021-03-28 22:53:44 396

原创 Perl 入门笔记

文章目录1. 数据类型和结构标量(scalar)数字字符串列表(list)和数组(array)Larry 在20世纪80年代设计创建了 Perl,现在由 Perl5 Porters 团队维护 。Perl 语法简洁,适合处理与文字有关的任务。CPAN 是一个存放用 Perl 编写的软件及其文档的网络存档,在全球有数百个镜像站点。1. 数据类型和结构A variable is a name for a container that holds one or more values.A scalar

2021-03-26 17:38:03 237

原创 生信分析流程框架概述

makeCommon Workflow Language (CWL)CWL是一种描述命令行工具并将它们连接在一起以创建工作流的规范。CWL文件使用YAML或JSON格式编写。调用形式一般为 cwl-runner [tool-or-workflow-description] [input-job-settings],即工作流描述和输入文件作为参数提供给CWL运行器。例1. cwl-runner echo.cwl echo_input.yaml#############################

2021-03-18 22:50:00 1942

原创 算法思维:递归,分治,排序,动态规划

文章目录1. 递归1.1 算法思想1.2 案例1) 汉诺塔2) 斐波那切数列1. 递归递归(Recursion):在函数的定义中使用函数自身的方法。1.1 算法思想递归的基本思想是把规模大的问题拆解为规模小的,相同的子问题来解决(递推公式)。并且解决问题的函数必须有明确的结束条件(终止条件)。其数学模型是归纳法。1.2 案例1) 汉诺塔大梵天做了三根金刚石柱子,在一根柱子上从小到大摞着64片黄金圆盘。它命令婆罗门把圆盘按原有顺序摆放到另一根柱子上,要求每次只能移动一个盘子,且小盘上不能放大

2021-03-06 21:15:31 163

原创 常见数据结构的简介(基本概念 & 操作 & 时间复杂度)

文章目录0. 概览1. 线性表、栈和队列2. 数组2.1 基本操作1) 时间复杂度2) 案例3. 字符串3.1 存储结构3.2 基本操作1) 时间复杂度2) 案例:最大公共字符串4. 二叉树4.1 储存结构4.2 基本操作《重学数据结构与算法》学习笔记0. 概览数据结构增删查特点线性表变长栈队列数组O(1), O(n)O(1),O(n)O(1), O(n)定长字符串二叉树哈希表1

2021-03-05 14:30:28 543 1

原创 [更新中] NGS常见软件和数据库(肿瘤/遗传病)

变异分析

2021-02-27 17:07:59 2144 1

原创 向量空间模型

1. 基础1.1 向量空间如果 V 满足向量的加法和乘法封闭性,我们就称 V 是 F 上的向量空间。1.2 向量间的距离曼哈顿距离欧氏距离切比雪夫距离闵氏距离1.3 向量长度L1​ 范数 ∣∣x∣∣ ,它是为 x 向量各个元素绝对值之和,对应于向量 x 和原点之间的曼哈顿距离。L2​ 范数 ∣∣x∣∣2​ ,它是 x 向量各个元素平方和的 1/2​ 次方,对应于向量 x 和原点之间的欧氏距离。Lp​ 范数 ∣∣x∣∣p​ ,为 x 向量各个元素绝对值 p 次方和的 1/

2021-02-19 22:50:50 517

原创 显著性检验

1. 基本概念两组数据的差异可能来源于:(1) 分布差异。(2)抽样误差,见上图。其中由分布造成的差异被称作显著性差异。统计假设检验是指事先对随机变量的参数或总体分布做出一个假设(Null Hypothesis, H0),然后根据样本信息决定是否拒绝原假设。具体步骤如下。在原假设条件下,计算事件发生,即样本出现的概率(p value)。若概率小于显著性水平(α),则拒绝原假设;否则,接受原假设。显著性检验的原假设是多组数据来自于同一个分布。2. 种类2.1 t检验2.2 方差分析(ANO

2021-02-18 21:22:17 2151

netMHCpan-2.8a.Linux.tar.gz

netMHCpan-2.8a用于预测肽和MHC亲和力。

2023-10-18

netMHCstabpan-1.0b.Linux.tar.gz

netMHCstabpan-1.0b用于预测pHC稳定性。

2023-10-18

netChop-3.1d.Linux.tar.gz

netchop-3.1用于预测蛋白酶切割,包括20S和C-term。

2023-10-18

netMHCpan-4.1b.Linux.tar.gz

netMHCpan-4.1b (linux) 利用人工神经网络预测肽与任何已知序列MHC分子的结合。该方法是在超过 85 万个定量结合亲和(BA)和质谱洗脱配体(EL)肽的组合上训练出来的。 BA 数据涵盖了来自人类(HLA-A、B、C、E)、小鼠(H-2)、牛(BoLA)、灵长类(Patr、Mamu、Gogo)、猪(SLA)和马(Eqca)的 170 种 MHC 分子。 EL 数据涵盖来自人类(HLA-A、B、C、E)、小鼠(H-2)、牛(BoLA)、灵长类(Patr、Mamu、Gogo)、猪(SLA)、马(Eqca)和狗(DLA)的 177 种 MHC 分子。 此外,用户还可以通过上传全长的 MHC 蛋白序列,对任何自定义的 MHC I 类分子进行预测。可以对任何长度的肽进行预测。

2023-10-12

netCTL-1.2b.Linux.tar.gz

NetCTL-1.2(linux)用于预测蛋白序列的CTL(细胞毒性T淋巴细胞)表位。

2023-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除