自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Baimoc

格物致知,知行合一

  • 博客(245)
  • 资源 (5)
  • 收藏
  • 关注

原创 白墨的生物信息自学之路

进入21世纪后,组学数据井喷式产出,随之而来的问题是如何处理这些数据,挖掘背后隐藏的价值。人们想到利用包括计算机,物理学,数学,统计学在内学科的优势去解析这些大数据,随之催生出一门新的交叉学科,这就是生物信息学。这门学科为生物进化,物种分类,育种技术,药物设计等领域起到巨大的推动作用。不仅使我们更加全面的认识生命,而且随之带来了丰厚的社会效益。这里记录了我学习生物信息时,在平坦道路上曲折前行的步伐。可以为打算学,正在学生物信息的同学提供一些参考,少走一些弯路。让我们一起披荆斩棘,乘风破浪。这.

2020-12-16 10:50:05 5063 12

原创 图解统计学 10 | 贝叶斯公式与全概率公式

图文详解贝叶斯公式与全概率公式

2023-01-21 14:52:43 449

原创 理解泛型调用和函数调用签名

理解泛型调用和函数调用签名

2023-01-18 17:18:48 13

原创 一文读懂 UniProt 数据库(2023 最新版)

Uniprot (*Universal Protein* )是包含蛋白质序列,功能信息,研究论文索引的蛋白质数据库,整合了包括EBI( European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大数据库的资源。

2023-01-17 13:29:04 472

原创 React 项目部署后,页面404解决

这是因为实际上并没有这样的物理路径,或者没有配置路由请求,所以内容无法显示,而显示404错误。本地运行,URL为真实的URL,BrowserRouter 可以直接访问到真实 URL。但是项目打包后,当页面刷新或跳转新页面时,客户端浏览器会向服务器请求URL。服务器会去找build文件夹下的html文件,发现找不到URL指定的路径。BrowserRouter 换成 HashRouter。

2023-01-04 11:45:59 123

原创 React 开发 | 常用 Hooks

React 开发之 Hooks

2022-12-09 10:30:40 182 1

原创 React 开发 | 父子组件间通信

React 组件间通信,父传子,子传父

2022-11-16 22:11:26 153 2

原创 React 开发 | 样式模块化

React 的样式模块化避免样式冲突

2022-11-16 22:09:28 129

原创 一文读懂相分离(图文详解)

相分离本身是一个物理化学概念,二元或多元混合物会在一定的条件下分离为不同的相。生活中可以见到水上漂浮的油滴,就是一种相分离现象。一共两种相,即水和油,由于都是液体,也叫液液相分离()。回顾下我们幼儿园学过的知识:生物进化过程中,在细胞内会用膜分割一些执行特定生物学功能的空间,称为有膜细胞器,这其中就有我们熟悉的线粒体,高尔基体等。这样的好处是方便构建特定反应体系和反应环境,并避免膜内蛋白或反应物质影响外界环境。比如,线粒体的细胞色素 C 如果释放到胞质内,将导致细胞凋亡。

2022-10-28 19:21:30 1838 3

原创 Chrome 将 http 域名自动跳转 https 的解决方案

Chrome 将 http 域名自动跳转 https 的解决方案

2022-09-01 18:56:37 1042

原创 图解机器学习之回归模型性能评估指标

机器学习中,回归模型性能评估指标

2022-06-03 11:04:30 780 2

原创 生物序列比对的几种应用场景(图文)

今天和大家讨论几种序列比对的应用场景,当然只是抛转引玉,如果小伙伴有其他应用场景,欢迎讨论。

2022-05-16 18:47:18 826

原创 axios 使用详解

一、安装cnpm install axios二、使用三种写法// 第一种写法axios.get('/query?name=tom').then(function (response) { console.log(response);}).catch(function (error) { console.log(error);});// 第二种写法axios.get('/query', { params: { name: 'tom' }})

2022-05-16 16:20:58 10462

原创 数据库涉及大量数据查询时的注意事项

避免频繁连接和关闭数据库,这样会导致IO访问次数太频繁。设计表时要建立适当的索引,尤其要在 where 及 order by 涉及的列上建立索引避免全表扫描,以下情况会导致放弃索引直接进行全部扫描避免在 where 子句中使用!=或<>操作符避免在 where 子句中对字段进行 null 值判断select id from table where num is null解决方法:建表时设置默认值0,也就是将null用0填充,然后查询:select id fr..

2022-05-16 11:44:30 855

原创 图解机器学习:分类模型性能评估指标

人间出现一种怪病,患病人群平时正常,但偶尔暴饮暴食,这种病从外观和现有医学手段无法分辨。为了应对疫情,准备派齐天大圣去下界了解情况。

2022-05-05 12:48:34 1469

原创 Python 中变量的多种复制方法(常规拷贝,浅拷贝,深拷贝)

常规拷贝大家常用的变量复制方法,用“=”就行。但是!但是!但是!在我们复制字典和列表时会和我们预想的不一致接下来,做个小实验常规拷贝在原始变量 x 的改变后,因为共用同一个内存地址,因此会直接放到被复制的变量 y 上,导致“不知情”的情况下导致 y 变量在没有操作的情况下改变。浅拷贝解决办法就是使用浅拷贝浅拷贝会将两个变量分别放在不同的内存地址,解决了常规拷贝的缺点。深拷贝但是,对于字典或列表中有嵌套的情况,浅拷贝同样不会生效。这时候就需要用的深拷贝。可以看到,深拷贝可以解决

2022-03-10 12:13:44 4397

原创 生物信息学导师推荐(持续更新)

本系列会持续更新,帮助大家找到更适合自己的导师,注意排名不分先后,接下来我们开始介绍:陈润生])单位:中国科学院生物物理研究所方向:长非编码RNA以及编码小肽的系统发现和功能机制研究成果:参加人类基因组1%和水稻基因组工作草图的研究;非编码RNA数据库NONCODE主页:http://people.ucas.ac.cn/~runshengchen邮箱: crs@ibp.ac.cn刘小乐单位:Harvard Medical School方向:表观遗传,癌症,发育成果:MACS(Mod

2022-01-05 20:57:22 2301 1

原创 JS 中 Json 数据的快速排序

主角为 `sort(sortby)`参数 `sortby` 是一个比较函数,该函数要比较两个值(a,b),返回值用来描述两个值的大小,具体规则为:- a < b,返回负值,排序后, a 在 b 之前- a = b,返回 0- a > b,返回正值,排序后, a 在 b 之后

2021-12-02 21:22:49 2869 11

原创 Nginx 配置详解

Nginx 配置文章目录Nginx 配置文件结构全局配置events 配置http 配置server 配置Rewrite一、地址重写,地址转发,重定向二、URL 重写语法:使用:三、if 指令使用1、变量匹配2、判断请求的文件是否存在3、判断手机访问4、其他四、防盗链1. 根据请求文件类型实现防盗链配置实列如下:文件结构整体结构为嵌套结构:全局块:配置影响全局,包括运行 nginx 的用户组,进程存放,日志,配置文件等events:配置影响 nginx 服务器与客户端的网络连接,包括进程最大连接

2021-10-24 21:14:14 6400

原创 从水果连连看到两条序列比对

一、序列比对 Sequence Alignment序列比对(sequence alignment),是目前生物学的基本研究方法。过程类似连连看,规则就是如果上下两行代表两条序列,如果上下一样就可以计分,我们来试一试:现在把水果换成碱基,如果可消除中间连线,我们再来看下AACGGGGTG | ||| |CATGGGATT我们已经实现了一个简单的序列比对。序列比对最终结果可以获得序列相似性比对值,然后通过统计学分析后,得到序列间的相似性与同源性,以及它们的显著性水平即可进行生物信息分析。如

2021-10-24 14:41:50 4687

原创 查看并关闭占用端口

查看占用端口sudo lsof -i:8888关闭占用端口sudo kill -9 2558243

2021-10-24 12:02:17 189

原创 用 Zotero 高效管理文献(图文详解)

一、下载与安装下载网址:https://www.zotero.org/download注册网址:https://www.zotero.org/user/register二、同步设置这一步极其重要,是 Zotero 强大功能的起点,我们可以将感兴趣的论文的 PDF,文献信息存放在云端,结合PDF 阅读器,甚至可以把 PDF 上的笔记一起保存到云端。当有需要的时候,可以从浏览器,电脑,手机,平板来访问这些信息。1、进入首选项2、输入刚刚注册信息,登录电脑版 Zotero,点击设置同步3、同步

2021-10-07 20:53:32 2590

原创 Ubuntu 服务器安装远程 Rstudio(图文详解)

文章目录一、环境二、安装三、常用操作重启关闭启动检测配置文件查看状态四、配置`rserver.conf` 配置清单`rsession.conf` 配置清单一、环境系统:Debian 10 / Ubuntu 18 / Ubuntu 20R版本:> 3.0二、安装sudo apt-get install r-basesudo apt-get install gdebi-corewget https://download2.rstudio.org/server/bionic/amd64/rst

2021-10-07 20:12:20 1854

原创 解析 Ensembl 的数据库服务器

Ensemble 对于学习生物信息学的我们来说应该是如数家珍了,但是我们平时常用到的操作一般是去查基因,下载基因组,这些都是通过网页端来完成:http://uswest.ensembl.org/index.html上面网页展示的就像大家进入某宝商店中的商品展示图,而真正的货物是存放在仓库的。Ensemble 则是将其“货物”是存放在数据库服务器中。理解 Ensemble 的数据库存储结构与架构,对于我们的今后的生信研究工作大有裨益。接下来,我们进入 Ensemble 的数据仓库世界,去看看它的货物有

2021-09-15 21:06:38 2675

原创 归一化与标准化

一、归一化对原始数据缩放到 0-1 之间,是线性变换。也叫最大最小标准化,离散标准化。区间也可以设置为其他,一般为 0 - 1。公式:X=x−minmax−min X = \frac{x-min}{max-min } X=max−minx−min​min 为数据最小值,max 为数据最大值,x 为原始数据值,X 为归一化后的值。x=X′(max−min)+min x = X^{\prime}(max-min)+min x=X′(max−min)+min特点虽然归一化可以保留原始数据中存在的关

2021-09-07 21:27:56 590

原创 vuex 监听数组或对象

store.js/* * @Author: Zheng Lei * @Email: baimoc@163.com * @Date: 2020-06-14 09:47:03 * @LastEditTime: 2021-08-12 17:20:02 * @FilePath: \EmAtlas\src\store.js */import Vue from 'vue'import Vuex from "vuex"Vue.use(Vuex);export default new Vuex.S

2021-08-14 10:05:07 369

原创 保姆级 IGV 基因组浏览器使用指南(图文详解)

一、软件下载http://software.broadinstitute.org/software/igv/download这里以下载 Windows 版本为例,下载带有 Java 的版本,方便安装。由于大部分数据是通过服务器跑出的结果,所以也有小伙伴有在 Linux 服务器端使用的需求。这里推荐几种方式:配合远程控制软件来使用,国产推荐 Todesk,向日葵话说目前有部分单位禁止远程软件,推荐结合 Jupyter 来使用建立 FTP 来通过 url 访问建议最好安装在固态硬盘所在分

2021-08-06 08:22:13 6677

原创 linux 命令 argument list too long 错误解决

解决ls | xargs -n 100 gunzip -fxargs 命令会将文件以每 100 个为一组来使用 gunzip 解压,同理 cp,mv,rm 等命令同样适用原因使用以下命令解压了超过三十万个压缩文件:gunzip -f ./*.gz命令后的文件夹数量太多,导致命令行过长就会报该错...

2021-07-29 10:28:17 678

原创 生信软件 | STAR(测序序列与参考序列比对)

文章目录零、介绍一、安装二、使用1、建立索引2、STAR 比对三、原理聚类、拼接和评分零、介绍STAR (Spliced Transcripts Alignment to a Reference),用于将测序的 Read 对齐到参考基因组的比对软件,常用于 RNAseq。因其具有较高的准确率,映射速度较其他比对软件高 50 多倍,因此作为 ENCODE 项目的御用 pipeline 工具。不得不提的是,它需要占用大量内存,对计算资源有较高的要求。一、安装conda install -c biocon

2021-07-14 22:13:35 7514 6

原创 单细胞分析的 Python 包 Scanpy(图文详解)

文章目录一、安装二、使用1、准备工作2、预处理过滤低质量细胞样本3、检测特异性基因4、主成分分析(Principal component analysis)5、领域图,聚类图(Neighborhood graph)6、检索标记基因7、保存数据8、番外一、安装如果没有conda 基础,参考: Conda 安装使用图文详解(2021版)pip install scanpyconda install -y -c conda-forge leidenalg二、使用1、准备工作# 载入包import

2021-07-14 18:00:30 13976 10

原创 Linux 查看并关闭端口

netstat -ap | grep 8002 # 8002端口号显示关闭kill -9 659044 # PID号

2021-06-10 22:17:53 557

原创 一文读懂参考基因组和基因组注释+最全下载方法

文章目录一、什么是参考基因组和基因组注释?二、参考基因组版本命名1、常用人参考基因组对应表2、常用小鼠参考基因组对应表三、下载1、NCBI2、Ensemble3、GENCODE4、UCSC5、iGenomes四、其他参考基因组信息一、什么是参考基因组和基因组注释?先来理一理参考基因组,基因组注释文件,测试数据间的关系。自从 1990 启动的家喻户晓的人类基因组计划开始,全世界的科学家竭尽全力破译了第一个完整的人类基因组,从那时开始人类拿到了一本只有 ATCG 四个碱基书写的天书。后续人们逐步完善了基因

2021-06-02 22:26:12 18496 2

原创 scanpy 单细胞分析包图文详解 01 | 深入理解 AnnData 数据结构

一、环境准备:搭建 Python 高效开发环境: Pycharm + Anaconda二、安装 scanpypip install scanpy三、AnnData1、AnnData 介绍与结构AnnData 是用于存储数据的对象,一般作为 scanpy 的数据存储格式。主要由以下几部分构成:功能数据类型adata.X矩阵数据numpy,scipy sparse,matrixadata.obs观察值数据pandas dataframeadata.v

2021-04-23 20:53:13 4820 2

原创 详解 R 语言的PCA与TSNE的降维聚类

为了查看降维聚类的可视化效果,我们先用相似样本降维聚类,然后使用具有差异的样本查看聚类效果。同时使用 PCA 与 TSNE 来观察两种不同方法的聚类效果。文章目录一、相似样本的降维聚类1、载入所需的包2、构建两个相似样本数据集3、绘制热图4、绘制PCA5、绘制TSNE二、差异样本的降维聚类1、构建第三个具有差异的数据集2、绘制热图3、绘制PCA4、绘制TSNE全部代码一、相似样本的降维聚类1、载入所需的包rm(list=ls())library(pheatmap)library(Rtsne)

2021-04-22 10:49:45 2737

原创 最新 NCBI 上传测序数据教程 (图文详解)

1、登录或注册用户网址:https://www.ncbi.nlm.nih.gov/account/2、进入SRA网址:https://submit.ncbi.nlm.nih.gov/向下滚动,找到Sequence Read Archive (SRA)工具,点击Submit2、新建提交3、按要求填写信息4、使用ascpascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload/raw/ sub

2021-04-14 15:30:17 10047

原创 转录组自动化分析流程搭建及使用

这次分析流程搭建使用基于Nextflow 的 nf-core,该工具可以实现自动化的转录组上游分析。官网:https://nf-co.re/rnaseqGitHub:https://github.com/nf-core/rnaseq安装 nf-core rnaseq可以使用Git clone,也可以下载好解压到流程目录安装Nextflowcurl -s https://get.nextflow.io | bash检测版本是否符合nf-core使用,可以升级nextflow self-upd

2021-03-22 19:35:09 901

原创 Excel 做统计学分析

数据分析插件1、进入 Excel 点击选项2、在加载项中点击转到3、打开分析工具库扩展4、选择数据标签页,点击数据分析5、选择适合数据的分析方法,这里以方差分析为例6、配置分析需要的选项在输入区域输入对应的数据,利用鼠标指针框选带有样本分组标志的数据集,比如下图这样选中标志位于第一行,用于标记分组名称α(A)是显著性水平,0.05代表95%的可信度选中输出区域,将输出结果打印在Excel中,或者可以选新建工具表组7、最后,生成对应的分析结果表里

2021-03-19 20:37:05 6788 2

转载 Web开发路线图(2020)

通用技能前端开发后端开发DevOps 路线图原文:https://github.com/ccloli/developer-roadmap-zh-CN

2021-03-09 09:39:59 3385

原创 图解三代测序(SMRT Sequencing)

文章目录一、基本原理二、构建文库三、测序芯片四、上机测序五、测序模型1、Circular Consensus Sequencing (CCS)2、Continuous Long Read (CLR) Sequencing六、其他影响因素1、GC bias 影响2、读长的限制因素3、测序通量目前主流三代测序平台除了Oxford 家的 Nanopore,还有 Pacific Biosciences(简称 PacBio)公司的 Single Molecule Real-Time(SMRT)Sequencing。

2021-03-03 19:57:37 7288 2

原创 最新最全 VSCODE 插件推荐(2023版)

文章目录一、主题及图标GitHub ThemeMaterial ThemeMaterial Icon Themevscode-icons二、功能强化settings syncwakatimePolacodeChinese (Simplified) Language Pack for Visual Studio Code三、Git 集成插件GitHub Pull requestsGit GraphCodeStream: GitHub, GitLab, Bitbucket PRs and Code Review

2021-02-20 11:38:07 167369 69

SARS-CoV-2.gb

基因序列分析例子数据

2020-12-21

生物信息聚类热图_示例数据

用于‘生物信息可视化 01 | 聚类热图’的例子数据,其中数据均为虚拟数据,与实际生物学过程无关,原文地址:https://blog.csdn.net/u011262253/article/details/100638123

2019-09-08

Trimmomatic Manual

Trimmomati 用于去除 Illumina平台的FASTQ序列中的Adapter,根据碱基质量值修整FASTQ序列文件

2019-03-26

aspera-connect-3.7.4.147727-linux-64.tar.gz

用于极速下载aspera支持的资源,生物信息用于NCBI,EBI基因组下载

2018-05-09

对仿QQ的头像选择弹出的对话框,酷似!

自定义的对话框,eclipse下运行通过

2015-06-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除