生物信息数据库开发之单细胞数据库scrna db(一)

优质已整合的单细胞数据库

如果读者只想获得一个现成的内容丰富的单细胞数据库加入至自己的PC或linux服务器,可以跳过下面的详细理论教程
数据库下载链接: 点击下载单细胞数据库
包含约800个细胞数据的中小型数据库,维度约为20000x800,部分为作者公司数据,部分为国际数据库数据,包含T-cell, B-cell,NK-cell,Astrocyte-cell等共约40种细胞类型,已经过sizefactor和批次效应处理,可随时应用到单数据分析工作,并附带API脚本,可执行查询任务。

背景知识

随着单细胞测序平台dropseq,10x等普及,越来越多的单细胞数据被NCBI等国际数据库收录。单细胞数据格式与转录组数据类似,同样是表达矩阵,rownames都是gene,colnames的话单细胞是细胞barcode,转录组是样本名称。目前市面10x平台测序公司稳定能测到10000-20000个细胞,所以总矩阵维度单细胞要高很多。目前市面上有多种形式来存储单细胞数据,包括csv,seurat h5ad,h5文件等,所以自己建立单细胞数据库就需要整合多种形式的数据,下面就来具体说说大体的处理思路。

需求分析

那么构建一个自己的单细胞数据库的意义在哪里?

  1. 新数据和旧数据进行差异分析:
  2. 聚类分析:
  3. pathway分析:

数据库类型

  1. 传统的关系型数据库,mysql,postgresql,python或R dataframe等
  2. 非关系型数据库,MongoDB,HBase等

数据库构建过程

  1. 原始数据获得
  2. 数据size factor和批次效应处理
  3. 矩阵合并
  4. 关联单细胞metadata

数据库下载链接: 点击下载单细胞数据库
单细胞数据库构建教程未完待续,下一篇将详细解释上面的提纲内容,敬请期待!

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北京生信课堂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值