北京生信课堂
生信课堂主讲师背景介绍:海外生信学硕士。先后就职美国Acurascience,美国Igenomics,主要研究生物信息pipeline搭建,算法开发,日常工作的程序语言为python,R和C++,订阅专栏后可获得作者专属技术支持哦。
展开
-
MultiIndex has no single backing array. Use ‘MultiIndex.to_numpy()‘ to get a NumPy array of tuples.
这通常表示你在使用 Pandas 中的多重索引,而你希望将它转换为 NumPy 数组。多重索引是 Pandas 中的一种索引类型,允许你在同一个数据框中使用多个索引列。要获取元组的 NumPy 数组,请使用 ‘multiindex.to_numpy()’。要将多重索引转换为 NumPy 数组,你可以使用 ‘multiindex.to_numpy()’ 方法。如果你已经安装pandas,首先将其卸载,然后安装pandas版本1.2.4即可使用原先的代码,而不更改代码。原创 2023-09-20 14:42:09 · 201 阅读 · 0 评论 -
Annovar报错: `Argument “G“ isn‘t numeric in numeric eq (==) at ./annotate_variation.pl line 2583, <DB>
当我们尝试使用Annovar软件(下载链接:https://annovar.openbioinformatics.org/en/latest/user-guide/download/)中提供的数据库如千人基因组1000genome(下载链接:http://www.openbioinformatics.org/annovar/download/hg19_1000g2012apr.zip。这里ex2为Annovar转换VCF格式后生成的文件。原创 2023-09-07 09:00:44 · 285 阅读 · 0 评论 -
甲基化钟生物信息项目实战--通过450K,850K数据预测样本的甲基化年龄(R语言代码)
甲基化芯片(450K,850K数据)和全甲基化测序(WGBS)。在生物学领域,通过细胞的甲基化程度来衡量人类的年龄,则叫甲基化钟。通过450K,850K数据,运用生物信息手段,预测样本的甲基化年龄。这个过程几乎可以达到自动化,需要掌握基础的R语言技术(如dataframe,vector处理等),当然如果无法正常运行,私信即可解决。例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。该处使用的url网络请求的数据。原创 2023-03-07 15:27:09 · 744 阅读 · 1 评论 -
replacement has 2 rows, data has 0, 解决R语言如何动态生成dataframe
replacement has 2 rows, data has 0, 解决R语言如何动态生成dataframe如何解决R语言bug:replacement has 2 rows, data has 0一个将ensemble id转换成gene名的python 脚本如何解决R语言bug:replacement has 2 rows, data has 0亲亲们好,我们使用R语言的时候,想动态生成一个dataframe,即列名称和列数据都是从文件中读取或者或者其他vector里实时获取的,所以,你可能想进原创 2022-06-12 14:45:45 · 1791 阅读 · 0 评论 -
一款使用sklearn基础包机器学习糖尿病患者体内微生物含量数据的软件
微生物与人类共生,对人类的健康影响重大,人体内各类微生物的含量和状态应该保持稳态,除非人体患病。目前二大测序技术的广泛普及,从患者体内获取样本直接测宏基因组的含量变得非常可行。我获取了4400名健康和患糖尿病的数据,体内的微生物含量以及换算成百分比,加和比例接近1。使用sklearn机器学习包,为4400个样本建立模型,希望通过机器学习来区分健康与糖尿病患者,仅仅根据他们体内的微生物含量数据。...原创 2019-09-25 09:46:08 · 586 阅读 · 3 评论 -
package ‘XXXX’ is not available (for R version 3.6.0) 解决R版本适配的问题
package ‘XXXX’ is not available (for R version 3.6.0) 解决R版本适配的问题原创 2022-09-07 15:02:47 · 11398 阅读 · 0 评论 -
生物信息学之rnaseq转录组分析流程--转换文件中的ensemble id到gene名
生物信息学之rnaseq转录组分析--转换文件中的ensemble id到gene名如何解决转录组分析中count之后遇到ensemble id的问题一个将ensemble id转换成gene名的python 脚本如何解决转录组分析中count之后遇到ensemble id的问题亲亲们好,我们做生物信息转录组分析的时候,可以走如下流程鸭:1.获取fastq或者fasta原始文件:获得这些原始测序文件的途径还是挺多的哈,有的可能是你的老师直接放在网盘里;有的需要自己进行数据挖掘,到NCBI啦,GEO啦原创 2022-04-28 10:21:51 · 3112 阅读 · 0 评论 -
R语言bug biomaRt filter_没有适用于c(‘tbl_SQLiteConnection‘, ‘tbl_dbi‘, ‘tbl_sql‘, ‘tbl_lazy‘, ‘tbl‘)目标对象的方法
解决biomaRt filter_没有适用于c('tbl_SQLiteConnection', 'tbl_dbi', 'tbl_sql', 'tbl_lazy', 'tbl'目标对象的方法什么是biomaRtbiomaRt都有些什么?使用biomaRt会遇到哪些bug,怎么解决?1.Error in UseMethod("filter_") : "filter_"没有适用于"c('tbl_SQLiteConnection', 'tbl_dbi', 'tbl_sql', 'tbl_lazy', 'tbl')原创 2022-04-12 16:41:58 · 1151 阅读 · 0 评论 -
BLAST Database error: No alias or index file found for nucleotide database [nt] in search path解决办法
Blast网页版做生物信息的应该都用过,输入你想比对的序列或者fasta文件提交网页就能出来结果。但如果你想用blast的命令行模式,用法会跟网页版非常不一样。新手会遇到很多问题,遇到频率最高的应该就是我这篇文章想说的问题BLAST Database error: No alias or index file found for nucleotide database [nt] in searc...原创 2019-11-14 14:28:34 · 31666 阅读 · 5 评论 -
R语言readxl或者tidyverse安装报错undefined symbol libiconv
wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.14.tar.gzmake&&make install之后仍无法解决解决办法如下:withr::with_makevars(c(PKG_LIBS = “-liconv”), install.packages(“haven”), assignment = “+=”)withr::with_makevars(c(PKG_LIBS = “-liconv”), install.packag原创 2021-10-12 17:01:58 · 1641 阅读 · 0 评论