白墨石-CSDN博客

原创白墨的生物信息自学之路

进入21世纪后，组学数据井喷式产出，随之而来的问题是如何处理这些数据，挖掘背后隐藏的价值。人们想到利用包括计算机，物理学，数学，统计学在内学科的优势去解析这些大数据，随之催生出一门新的交叉学科，这就是生物信息学。这门学科为生物进化，物种分类，育种技术，药物设计等领域起到巨大的推动作用。不仅使我们更加全面的认识生命，而且随之带来了丰厚的社会效益。这里记录了我学习生物信息时，在平坦道路上曲折前行的步伐。可以为打算学，正在学生物信息的同学提供一些参考，少走一些弯路。让我们一起披荆斩棘，乘风破浪。这.

2020-12-16 10:50:05 8934 21

原创图解表观遗传学 | 染色质相关 RNA调控

定义：能够直接或间接与染色质结合的 RNA，统称为。调控机制：近年来的证据显示，部分新生 RNA 会在共转录加工与 RNA 修饰过程中束缚在染色质上，并参与转录—染色质调控的反馈回路，在维持转录动力学、染色质可及性与表观遗传状态方面发挥核心作用。*：活性基因的启动子—增强子环状结构上，常可观察到 “RNA 云”（RNA 聚集焦点）：这些 RNA 焦点与 DNA 元件簇共定位，提示 RNA 在基因组三维调控中的空间组织角色。

2025-11-29 04:50:30 1157

原创基因组坐标系统的 0-based 和 1-based（图文详解）

基因组坐标中的 “0-based” 和 “1-based” 是两种不同的规范，用于表示基因组上的位置。它们在不同的上下文和文件格式中可能会有不同的使用方式。

2023-11-20 11:16:01 2020

原创图文详解 VCF 生信格式 (变异信息)

vcf （Variant Call Format）是一种用于存储基因组序列中的变异信息一般用在单核苷酸变异（SNV），小片段插入缺失（INDEL）等也用于拷贝数变异（CNV），SV（结构变异）等SNV：参考基因组在1号染色体7845190为 C，但检测样本在同样位置为 AINDEL：包含插入和缺失两种。

2023-11-09 12:21:41 9508

原创 git commit 规范及自动化

commit message需要包括两部分内容：header和body。

2023-10-06 11:00:28 1649

原创从零实现 promise 的 class 和 function 版本

【代码】从零实现 promise 的 class 和 function 版本。

2023-09-27 02:07:30 498

原创图解统计学 10 | 贝叶斯公式与全概率公式

图文详解贝叶斯公式与全概率公式

2023-01-21 14:52:43 3609

原创理解泛型调用和函数调用签名

理解泛型调用和函数调用签名

2023-01-18 17:18:48 969

原创一文读懂 UniProt 数据库（2025 最新版）

Uniprot （*Universal Protein* ）是包含蛋白质序列，功能信息，研究论文索引的蛋白质数据库，整合了包括EBI（ European Bioinformatics Institute），SIB（the Swiss Institute of Bioinformatics），PIR（Protein Information Resource）三大数据库的资源。

2023-01-17 13:29:04 25615 3

原创 React 项目部署后，页面404解决

这是因为实际上并没有这样的物理路径，或者没有配置路由请求，所以内容无法显示，而显示404错误。本地运行，URL为真实的URL，BrowserRouter 可以直接访问到真实 URL。但是项目打包后，当页面刷新或跳转新页面时，客户端浏览器会向服务器请求URL。服务器会去找build文件夹下的html文件，发现找不到URL指定的路径。BrowserRouter 换成 HashRouter。

2023-01-04 11:45:59 3956 2

原创 React 开发 | 常用 Hooks

React 开发之 Hooks

2022-12-09 10:30:40 713 1

原创 React 开发 | 父子组件间通信

React 组件间通信，父传子，子传父

2022-11-16 22:11:26 956 2

原创 React 开发 | 样式模块化

React 的样式模块化避免样式冲突

2022-11-16 22:09:28 696

原创一文读懂相分离（图文详解）

相分离本身是一个物理化学概念，二元或多元混合物会在一定的条件下分离为不同的相。生活中可以见到水上漂浮的油滴，就是一种相分离现象。一共两种相，即水和油，由于都是液体，也叫液液相分离（）。回顾下我们幼儿园学过的知识：生物进化过程中，在细胞内会用膜分割一些执行特定生物学功能的空间，称为有膜细胞器，这其中就有我们熟悉的线粒体，高尔基体等。这样的好处是方便构建特定反应体系和反应环境，并避免膜内蛋白或反应物质影响外界环境。比如，线粒体的细胞色素 C 如果释放到胞质内，将导致细胞凋亡。

2022-10-28 19:21:30 13977 4

原创 Chrome 将 http 域名自动跳转 https 的解决方案

Chrome 将 http 域名自动跳转 https 的解决方案

2022-09-01 18:56:37 4567

原创图解机器学习之回归模型性能评估指标

机器学习中，回归模型性能评估指标

2022-06-03 11:04:30 4704 2

原创生物序列比对的几种应用场景（图文）

今天和大家讨论几种序列比对的应用场景，当然只是抛转引玉，如果小伙伴有其他应用场景，欢迎讨论。

2022-05-16 18:47:18 3210

原创 axios 使用详解

一、安装cnpm install axios二、使用三种写法// 第一种写法axios.get('/query?name=tom').then(function (response) { console.log(response);}).catch(function (error) { console.log(error);});// 第二种写法axios.get('/query', { params: { name: 'tom' }})

2022-05-16 16:20:58 33996 1

原创数据库涉及大量数据查询时的注意事项

避免频繁连接和关闭数据库，这样会导致IO访问次数太频繁。设计表时要建立适当的索引，尤其要在 where 及 order by 涉及的列上建立索引避免全表扫描，以下情况会导致放弃索引直接进行全部扫描避免在 where 子句中使用!=或<>操作符避免在 where 子句中对字段进行 null 值判断select id from table where num is null解决方法：建表时设置默认值0，也就是将null用0填充，然后查询：select id fr..

2022-05-16 11:44:30 1837

原创图解机器学习：分类模型性能评估指标

人间出现一种怪病，患病人群平时正常，但偶尔暴饮暴食，这种病从外观和现有医学手段无法分辨。为了应对疫情，准备派齐天大圣去下界了解情况。

2022-05-05 12:48:34 5511

原创 Python 中变量的多种复制方法（常规拷贝，浅拷贝，深拷贝）

常规拷贝大家常用的变量复制方法，用“=”就行。但是！但是！但是！在我们复制字典和列表时会和我们预想的不一致接下来，做个小实验常规拷贝在原始变量 x 的改变后，因为共用同一个内存地址，因此会直接放到被复制的变量 y 上，导致“不知情”的情况下导致 y 变量在没有操作的情况下改变。浅拷贝解决办法就是使用浅拷贝浅拷贝会将两个变量分别放在不同的内存地址，解决了常规拷贝的缺点。深拷贝但是，对于字典或列表中有嵌套的情况，浅拷贝同样不会生效。这时候就需要用的深拷贝。可以看到，深拷贝可以解决

2022-03-10 12:13:44 16469 6

原创生物信息学导师推荐（持续更新）

本系列会持续更新，帮助大家找到更适合自己的导师，注意排名不分先后，接下来我们开始介绍：陈润生])单位：中国科学院生物物理研究所方向：长非编码RNA以及编码小肽的系统发现和功能机制研究成果：参加人类基因组1%和水稻基因组工作草图的研究；非编码RNA数据库NONCODE主页：http://people.ucas.ac.cn/~runshengchen邮箱： crs@ibp.ac.cn刘小乐单位：Harvard Medical School方向：表观遗传，癌症，发育成果：MACS（Mod

2022-01-05 20:57:22 8880 1

原创 JS 中 Json 数据的快速排序

主角为 `sort(sortby)`参数 `sortby` 是一个比较函数，该函数要比较两个值（a，b），返回值用来描述两个值的大小，具体规则为：- a < b，返回负值，排序后， a 在 b 之前- a = b，返回 0- a > b，返回正值，排序后， a 在 b 之后

2021-12-02 21:22:49 6869 11

原创 Nginx 配置详解

Nginx 配置文章目录Nginx 配置文件结构全局配置events 配置http 配置server 配置Rewrite一、地址重写，地址转发，重定向二、URL 重写语法：使用：三、if 指令使用1、变量匹配2、判断请求的文件是否存在3、判断手机访问4、其他四、防盗链1. 根据请求文件类型实现防盗链配置实列如下：文件结构整体结构为嵌套结构：全局块：配置影响全局，包括运行 nginx 的用户组，进程存放，日志，配置文件等events：配置影响 nginx 服务器与客户端的网络连接，包括进程最大连接

2021-10-24 21:14:14 83760 5

原创从水果连连看到两条序列比对

一、序列比对 Sequence Alignment序列比对（sequence alignment），是目前生物学的基本研究方法。过程类似连连看，规则就是如果上下两行代表两条序列，如果上下一样就可以计分，我们来试一试：现在把水果换成碱基，如果可消除中间连线，我们再来看下AACGGGGTG | ||| |CATGGGATT我们已经实现了一个简单的序列比对。序列比对最终结果可以获得序列相似性比对值，然后通过统计学分析后，得到序列间的相似性与同源性，以及它们的显著性水平即可进行生物信息分析。如

2021-10-24 14:41:50 7533

原创查看并关闭占用端口

查看占用端口sudo lsof -i:8888关闭占用端口sudo kill -9 2558243

2021-10-24 12:02:17 498

原创用 Zotero 高效管理文献（图文详解）

一、下载与安装下载网址：https://www.zotero.org/download注册网址：https://www.zotero.org/user/register二、同步设置这一步极其重要，是 Zotero 强大功能的起点，我们可以将感兴趣的论文的 PDF，文献信息存放在云端，结合PDF 阅读器，甚至可以把 PDF 上的笔记一起保存到云端。当有需要的时候，可以从浏览器，电脑，手机，平板来访问这些信息。1、进入首选项2、输入刚刚注册信息，登录电脑版 Zotero，点击设置同步3、同步

2021-10-07 20:53:32 10221

原创 Ubuntu 服务器安装远程 Rstudio（图文详解）

文章目录一、环境二、安装三、常用操作重启关闭启动检测配置文件查看状态四、配置`rserver.conf` 配置清单`rsession.conf` 配置清单一、环境系统：Debian 10 / Ubuntu 18 / Ubuntu 20R版本：> 3.0二、安装sudo apt-get install r-basesudo apt-get install gdebi-corewget https://download2.rstudio.org/server/bionic/amd64/rst

2021-10-07 20:12:20 6020

原创解析 Ensembl 的数据库服务器

Ensemble 对于学习生物信息学的我们来说应该是如数家珍了，但是我们平时常用到的操作一般是去查基因，下载基因组，这些都是通过网页端来完成：http://uswest.ensembl.org/index.html上面网页展示的就像大家进入某宝商店中的商品展示图，而真正的货物是存放在仓库的。Ensemble 则是将其“货物”是存放在数据库服务器中。理解 Ensemble 的数据库存储结构与架构，对于我们的今后的生信研究工作大有裨益。接下来，我们进入 Ensemble 的数据仓库世界，去看看它的货物有

2021-09-15 21:06:38 9507

原创归一化与标准化

一、归一化对原始数据缩放到 0-1 之间，是线性变换。也叫最大最小标准化，离散标准化。区间也可以设置为其他，一般为 0 - 1。公式：X=x−minmax−min X = \frac{x-min}{max-min } X=max−minx−minmin 为数据最小值，max 为数据最大值，x 为原始数据值，X 为归一化后的值。x=X′(max−min)+min x = X^{\prime}(max-min)+min x=X′(max−min)+min特点虽然归一化可以保留原始数据中存在的关

2021-09-07 21:27:56 5123

原创 vuex 监听数组或对象

store.js/* * @Author: Zheng Lei * @Email: baimoc@163.com * @Date: 2020-06-14 09:47:03 * @LastEditTime: 2021-08-12 17:20:02 * @FilePath: \EmAtlas\src\store.js */import Vue from 'vue'import Vuex from "vuex"Vue.use(Vuex);export default new Vuex.S

2021-08-14 10:05:07 796

原创保姆级 IGV 基因组浏览器使用指南（图文详解）

一、软件下载http://software.broadinstitute.org/software/igv/download这里以下载 Windows 版本为例，下载带有 Java 的版本，方便安装。由于大部分数据是通过服务器跑出的结果，所以也有小伙伴有在 Linux 服务器端使用的需求。这里推荐几种方式：配合远程控制软件来使用，国产推荐 Todesk，向日葵话说目前有部分单位禁止远程软件，推荐结合 Jupyter 来使用建立 FTP 来通过 url 访问建议最好安装在固态硬盘所在分

2021-08-06 08:22:13 58841 3

原创 linux 命令 argument list too long 错误解决

解决ls | xargs -n 100 gunzip -fxargs 命令会将文件以每 100 个为一组来使用 gunzip 解压，同理 cp，mv，rm 等命令同样适用原因使用以下命令解压了超过三十万个压缩文件：gunzip -f ./*.gz命令后的文件夹数量太多，导致命令行过长就会报该错...

2021-07-29 10:28:17 1412

原创生信软件 | STAR（测序序列与参考序列比对）

文章目录零、介绍一、安装二、使用1、建立索引2、STAR 比对三、原理聚类、拼接和评分零、介绍STAR （Spliced Transcripts Alignment to a Reference），用于将测序的 Read 对齐到参考基因组的比对软件，常用于 RNAseq。因其具有较高的准确率，映射速度较其他比对软件高 50 多倍，因此作为 ENCODE 项目的御用 pipeline 工具。不得不提的是，它需要占用大量内存，对计算资源有较高的要求。一、安装conda install -c biocon

2021-07-14 22:13:35 30020 11

原创单细胞分析的 Python 包 Scanpy（图文详解）

文章目录一、安装二、使用1、准备工作2、预处理过滤低质量细胞样本3、检测特异性基因4、主成分分析（Principal component analysis）5、领域图，聚类图（Neighborhood graph）6、检索标记基因7、保存数据8、番外一、安装如果没有conda 基础，参考： Conda 安装使用图文详解（2021版）pip install scanpyconda install -y -c conda-forge leidenalg二、使用1、准备工作# 载入包import

2021-07-14 18:00:30 43061 21

原创 Linux 查看并关闭端口

netstat -ap | grep 8002 # 8002端口号显示关闭kill -9 659044 # PID号

2021-06-10 22:17:53 2221

原创一文读懂参考基因组和基因组注释+最全下载方法

文章目录一、什么是参考基因组和基因组注释？二、参考基因组版本命名1、常用人参考基因组对应表2、常用小鼠参考基因组对应表三、下载1、NCBI2、Ensemble3、GENCODE4、UCSC5、iGenomes四、其他参考基因组信息一、什么是参考基因组和基因组注释？先来理一理参考基因组，基因组注释文件，测试数据间的关系。自从 1990 启动的家喻户晓的人类基因组计划开始，全世界的科学家竭尽全力破译了第一个完整的人类基因组，从那时开始人类拿到了一本只有 ATCG 四个碱基书写的天书。后续人们逐步完善了基因

2021-06-02 22:26:12 73431 2

Trimmomatic Manual

SARS-CoV-2.gb

生物信息聚类热图_示例数据

aspera-connect-3.7.4.147727-linux-64.tar.gz

对仿QQ的头像选择弹出的对话框，酷似！

空空如也