- 博客(87)
- 资源 (16)
- 收藏
- 关注
原创 DoubletFinder报错小结
DoubletFinder是一个R包,用于预测单细胞RNA测序数据中的双重细胞(doublets)。DoubletFinder实现了与Seurat版本2.0及以上版本的接口。
2024-11-04 20:11:50 307
原创 【OrthoFinder】直系同源基因分析工具
它是一个快速、准确和全面的比较基因组学工具。可以找到直系同源基因群和直系同源基因,为所有直系同源基因群推导出有根的基因树,并确定这些基因树中的所有基因复制事件。它还为被分析的物种推导出有根的物种树,并将基因树上的基因复制事件映射到物种树的分支上,为比较基因组分析提供全面的统计数据。它使用简单,运行它所需要的只是一组FASTA格式的蛋白质序列文件(每个物种一个)它与其他直系同源推断软件不同,OrthoFinder使用基因树。这意味着你可以在它所来自的基因树中检查每个直系同源关系。
2024-03-03 19:40:00 1958
原创 【 10X summary report】怎么看?详细解读笔记
在开始正式的分析之前,需要查看在对齐和计数过程中生成的任何总结统计信息。下图是由Cell Ranger工具创建的10X总结报告,在从10X scRNA-seq实验生成计数矩阵时会生成。下图为本人使用CellRanger V5.2.0对语一个单细胞数据跑出的结果。
2024-03-03 12:32:45 1450
原创 【降维算法UMAP】调参获得更适合的低维图
为什么要降维:单细胞转录组数据往往是数千*数万(细胞数*基因数)的矩阵数据,降维可以帮助可视化和理解大型高维数据集。降维算法:在单细胞转录组生信分析中,常见的降维算法有两种,UMAP和T-SNEUMPA运算速度会更快,并且在保留数据结构的同时提供了更好的扩展性。UMAP的主要步骤学习高维空间中的流形结构找到该流形的低维表示,优化低维图。
2024-03-03 12:20:46 6260
原创 【AUCell打分】:评估一个基因集在单细胞转录组的每个细胞中特定的活性程度
AUCell使用曲线下面积来计算输入基因集的一个有意义的基因子集是否在每个细胞的表达基因中富集。AUC 分数在所有细胞中的分布允许探索特征的相对表达。由于评分方法是基于排名的,因此 AUCell 与基因表达单位和归一化程序无关。此外,由于细胞是单独评估的,因此可以很容易地应用于更大的数据集。
2024-02-28 23:29:36 5593
原创 【R包报错】使用sceasy包转换rds文件与h5ad文件报错PyType_GetFlags
【代码】【R包报错】使用sceasy包转换rds文件与h5ad文件报错PyType_GetFlags。
2024-02-28 23:04:43 932
原创 机器学习笔记(8)——数据预处理&特征工程
机器学习笔记(8)——数据预处理&特征工程1. 数据预处理1.1. 数据无纲量化1.2.缺失值1.3. 处理分类型特征1.4.处理连续型特征2. 特征选择2.1.过滤法fliter2.1.1方差过滤2.1.2卡方过滤2.1.3选取超参数K过滤2.1.4F检验过滤2.1.5互信息法过滤2.2.embedded嵌入法2.3.wrapper包装法
2022-05-20 13:39:35 1404 2
原创 机器学习笔记(7)——决策树&随机森林代码
机器学习笔记(7)——决策树&随机森林代码本文部分图片与文字来源网络或学术论文,仅供学习使用,持续修改完善中。目录机器学习笔记(7)——决策树&随机森林代码1、决策树python写决策树sklearn实现决策树分类器sklearn实现决策树回归器2、随机森林sklearn实现随机森林分类器sklearn实现随机森林回归器sklearn用随机森林回归填补缺失值1、决策树决策树(Decision Tree)是一种非参数的有监督学习方法...
2022-05-02 12:04:37 4203
原创 机器学习笔记(6)——线性回归&逻辑回归
1、线性回归西瓜书线性回归代码sklearn实现一元线性回归sklearn实现多元线性回归线性判别分析LDA2、逻辑回归损失函数sklearn实现逻辑回归鸢尾花数据集做逻辑回归
2022-05-01 18:40:52 1576
原创 R语言可视化【ggplot2】
ggplot实现各种图形:类别比较:柱形图类别比较:条形图类别比较:克利夫兰点图类别比较:南丁格尔玫瑰图数值关系:散点图数值关系:气泡图数值关系:三维散点/气泡图数值关系:瀑布图数值关系:峰峦图数值关系:相关系数图数值关系:韦恩图数据分布:直方图数据分布:核密度估计图局部整体:直方图/密度图数据分布:散点分布图数据分布:柱形分布图数据分布:箱形图数据分布:小提琴图、雨云图数据分布:显著性标签的箱形图
2022-03-20 20:50:11 17779
原创 【生信】全基因组关联分析(GWAS)原理
【生信】全基因组关联分析(GWAS)1.前提知识介绍1.1 最小二乘法1.2 GWAS的数学原理1.3 Hardy-Weinberg定律&卡方检验1.4 连锁不平衡1.5 曼哈顿图1.6 箱式图Box-plot1.7 QQ plot2、GWAS的定义2.1 几个需要知道的概念:2.2全基因组关联分析3、GWAS——数据预处理3.1质控的原因:3.2基因型数据的质控:3.4表型数据质控:3.5正负链翻转3.6 基因型填补3.7群体分层校
2022-03-12 18:53:01 60478 10
原创 【生信】全基因组测序(WGS)
1、全基因组测序(WGS) 的定义2、GWS流程2.1准备工作——分析软件2.2原始数据质控2.3数据预处理2.4变异检测
2022-03-07 21:30:38 39399
原创 【生信MOOC】生物序列比对工具——多序列比对
【生信MOOC】生物序列比对工具2——多序列比对1、多序列比对的定义和用途2、多序列比对的要求3、多序列比对工具——EMBL - Clustal Omega4、多序列比对工具——EMBL - TCOFFEE - Expresso5、多序列比对的保存格式6、多序列比对结果编辑——jalview7、寻找保守区域:序列标识图 WebLogo8、寻找保守区域:序列基序 MEME9、寻找保守区域:PRINTS 指纹图谱数据库
2022-03-05 17:16:57 21130 5
原创 【生信MOOC】生物序列比对工具
1、需了解的背景知识2、替换计分矩阵核酸替换计分矩阵蛋白质替换计分矩阵3、序列比对方法(1)打点法(2)两两序列比对算法4、在线序列比对工具EMBL 全局双序列比对工具Biotools 的双序列比对工具
2022-03-04 13:54:28 6911
原创 【生信MOOC】生信数据库2
1、一级蛋白质序列数据库:UniProt 数据库2、一级蛋白质结构数据库:PDB数据库3、二级蛋白质结构数据库:结构域家族数据库Pfam4、二级蛋白质结构数据库:结构分类数据库CATH5、二级蛋白质结构数据库:结构分类数据库SCOP26、专项数据库:京都基因与基因组百科全书KEGG
2022-03-03 17:23:51 3764
原创 【生信MOOC】生信数据库1
1、认识生物数据库装载的内容2、生物数据库的分类3、文献数据库——PubMed4、一级核酸数据库——NCBI的Genbank数据库4.1——大肠杆菌dUTPas(脱氧尿苷焦磷酸酶)X01714的DNA序列4.2——编码人dUTPase的成熟mRNA序列U902234.3——编码人dUTPase的dut基因序列。序列AF0184305、一级核酸数据库——基因组数据库Ensemble6、一级核酸数据库——微生物宏基因组数据库JCVI7、二级核酸数据库
2022-03-01 20:32:28 4927
原创 HTML学习笔记
HTML学习笔记1.简介HTML 指的是超文本标记语言:HyperTextMarkupLanguage。HTML 不是一种编程语言,而是一种标记语言(标记语言是一套标记标签(markup tag))<!DOCTYPE html>声明为 HTML5 文档 <html>元素是 HTML 页面的根元素 <head>元素包含了文档的元(meta)数据,如<meta charset="utf-8">定义网页编码格式为utf-8...
2022-03-01 11:08:03 757
原创 【CentOS 7 64位】linux常用命令补充
【CentOS 7 64位】linux常用命令补充1、进程处理命令-ps命令-kill命令2、字符串处理命令-echo命令-grep命令
2022-02-10 15:53:02 303
原创 【生信】生物序列比对
1、生物序列比对介绍2、序列比对算法基于全局匹配的算法(1)打分矩阵(2)动态规划算法(3)Needleman-Wunsch算法基于局部匹配的算法Smith-Waterman算法Smith-Waterman算法与Needleman-Wunsch算法的区别启发式搜索算法BWT((Burrows–Wheeler_transform))算法3、多序列比对介绍
2022-02-09 16:57:33 9873
原创 【书籍】Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结
Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结
2021-12-31 12:29:09 990
原创 【生信】第一二三代测序技术原理的理解
作为生信初学者,对基因测序第一、二、三代测序技术的梳理和了解,详细介绍了几个广泛应用的测序技术原理如sanger测序和illumina测序等,仅供学习使用。
2021-12-31 12:01:47 16491 2
原创 【不想读paper的时候看看】阅读文献?
【不想读paper的时候看看】为何阅读文献?最近看了中国科学院大学(国科大/果壳)图书馆对我们一年级集中教学的同学关于图书馆资源与服务的培训PPT,我截取了一些较有感触的slides做一下笔记。
2021-12-28 14:31:35 712 1
原创 RNA编辑基本形式与相关技术的研究现状(阅读小结)
摘要:生物学的中心法则定义了遗传信息从DNA到RNA再到蛋白质的流动,通常RNA分子通常会准确地遵循其转录基因的序列。但转录后的RNA在编码区可能会发生碱基的加入、丢失或转换等现象,这导致了不同于其DNA模板的RNA产物的产生。RNA编辑是与细胞中功能基因mRNA中核苷酸的修饰有关的基本生化过程。近年来在动植物细胞的RNA编辑研究中都取得了显著的进展。RNA编辑研究对象多为动物细胞的细胞核和线粒体,或者植物细胞的线粒体和叶绿体,RNA编辑也是增加基因转录和功能多样性的重要形式[1]。而RNA编辑位点的预测是
2021-09-09 12:09:30 1931
原创 RNA editing restricts hyperactive ciliary kinases文章翻译
关于MOLECULAR BIOLOGY杂志在2021年6月26日发表的一篇RNA editing restricts hyperactive ciliary kinases文章的翻译前言白驹过隙,不知不觉我的码龄竟然也有四年了。目前,博主正在中国科学院大学雁栖湖校区进行研一的学习,是的,我跨专业保研了,研究生的方向是生物信息分析。与此同时,我也决定慢慢把写博客的习惯捡起来,往后的方向也会侧重生物信息方向的知识记录。刚刚开学两周,要重新学习生物方面的知识,我觉得是很有难度的,特别是深入之后发现生物信息
2021-09-09 12:07:47 715 1
原创 R语言4——字符串&列表&矩阵&数组
R语言4——R的数据类型2目录R语言4——R的数据类型21、字符串1.1 在字符串的语法中,单引号和双引号不能混用1.2 字符串连接函数——paste()函数1.3 字符串格式化函数——format()函数1.4字符串计算长度函数——nchar()函数1.5大小写转换函数——toupper()&tolower()函数1.6截取字符串函数——substring()函数2、列表3.矩阵1、创建矩阵函数——matrix()函数2、转置矩阵函数——t...
2020-11-01 10:43:39 4594
原创 R语言3——判断&循环
R语言3——R中的语法1.R中的判断结构ifif...elseswitch 语句x <- c(1,2,3,4,5)if(2 %in% x ){ print("2 in x")}else{ print("2 not in x")}if(2 %in% x ){ print("2 in x")}else if(6 %in% x ){ print("6 in x")}else{ print("6 not in x")}a <- swit.
2020-10-31 11:34:07 3378
原创 R语言2——数据类型和基本运算
R语言2——数据类型和基本运算目录R语言2——数据类型和基本运算1.R的数据类型1.R的数据类型(1)Logical(逻辑型):只有两个值TRUE, FALSE(2)Numeric(数字):整数、小数等(3)Complex(复合型):带有虚数i的数,如1+ 2i(4)Character(字符):包含在“ ”之中,如“hello!”(5)Vectors向量:c()函数,将元素组合成一个向量。c(1,2,3,4)(6)Lists列表:list()内容包含许多不同类型的元.
2020-10-25 22:48:00 2291
使用HTML+PHP搭建一个生物数据增删查改网站代码
2022-03-28
HTML+PHP搭建一个生物数据增删查改网站使用说明书
2022-03-28
RNA editing restricts hyperactive ciliary kinases.pdf
2021-09-09
电子商务知识点总结.docx
2020-01-03
医学统计学笔记——DL.zip
2019-09-18
超详细数据库系统与概论笔记2019上——个人笔记.zip
2019-08-07
超详细的Java复习知识点2019——个人笔记.zip
2019-06-24
csharpspider.7z
2019-06-11
c#草稿纸(记事本)
2019-05-07
c#表决器,选择候选城市,选择可以投票的选项数量,当选择数量为2时,只能选择二个候选城市,程序自动限制复选框的选择数量,按提交后选择的城市显示在编辑框中
2019-05-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人