AnnData对象包含以下主要部分:
- X:基因表达矩阵
- obs:细胞元数据(观测数据)
- var:基因元数据(变量数据)
- uns:未分类数据(杂项数据)
- obsm:多维细胞元数据
- varm:多维基因元数据
- layers:不同层的数据
生成对象代码
import numpy as np
import pandas as pd
import scanpy as sc
from anndata import AnnData
# 生成随机的基因表达数据
num_cells = 100 # 细胞数量
num_genes = 200 # 基因数量
# 生成一个随机的表达矩阵
expression_data = np.random.rand(num_cells, num_genes)
# 创建细胞和基因的元数据
cell_ids = [f'cell_{i}' for i in range(num_cells)]
gene_ids = [f'gene_{i}' for i in range(num_genes)]
# 生成DataFrame以存储细胞和基因的信息
obs = pd.DataFrame(index=cell_ids) # 细胞信息(观测)
var = pd.DataFrame(index=gene_ids) # 基因信息(变量)
# 创建AnnData对象
adata = AnnData(X=expression_data, obs=obs, var=var)
# 查看AnnData对象
print(adata)
1393

被折叠的 条评论
为什么被折叠?



