自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 高维数组保存到文件存储空间对比

【代码】高维数组保存到文件存储空间对比。

2024-08-26 16:22:28 204

原创 数据收集-分化轨迹推断

Ranek, J.S., Stanley, N. & Purvis, J.E. Integrating temporal single-cell gene expression modalities for trajectory inference and disease prediction. Genome Biol 23, 186 (2022). https://doi.org/10.1186/s13059-022-02749-0The raw publicly available single-ce

2024-05-10 18:14:27 852

原创 V100 配置 Scanpy + Scvi + Pytorch

该命令自动安装的是cpu版本的Pytoch 2.0.0,因此需要手动安装gpu版本Pytorch。

2023-11-15 21:46:19 771 1

原创 论文解析-moETM-多组学整合模型

使用BMMC2数据集,把moETM训练得到的cell-by-topic matrix进行UMAP可视化,与其他方法得到的cell embdding可视化进行对比。查看匹配的peak-gene、gene-protein的相关系数分布显著高于0,并且和观测值得到的分布类似。说明,cell-by-topic matrix既消除的BatchEffect,又识别了细胞类型。表明模型可以对观测数据的噪声进行降噪和混杂校正,更能反映单细胞中的不同组学的相关性。对于每个topic,计算134对。,则认为他们是匹配的。

2023-10-17 22:39:29 495

原创 论文解析-基因序列编码算法DeepSEA

来自ENCODE的等位基因失衡信息的DNase-seq数据,包括35种细胞类型的57,407个等位基因失衡的SNPs,其中28,918个是参考等位基因偏差的变异、28,489个替代等位基因偏差的变异。图b种横(纵)轴表示DeepSEA预测的替代(参考)等位基因偏差的变异为DHS的概率,蓝色(红色)表示实验确定的替代(参考)等位基因偏差,黑线为确定预测可信度的阈值。基于基因序列预测基因序列的非编码变异的功能影响,具体包括预测非编码区域的调控信息、疾病或性状相关的SNP、非编码eQTLs等。

2023-09-14 22:14:40 548

原创 Mendelay-文献管理软件使用教程

通过邮箱就可以注册账号啦,这是登录后的页面,并下载Mendeley客户端。安装好客户端,打开软件首先登录以上注册的账号,则可进入客户端首页。

2023-09-14 16:43:07 525

原创 Linux系统安装与配置Anaconda

输出类似下图则说明安装成功啦!

2023-08-24 18:16:13 229

原创 Anaconda虚拟环境跨系统迁移

注意:如果当前路径已经有了 environment.yml 文件,conda 会重写这个文件。

2023-08-23 23:02:40 255

原创 深度学习环境配置避坑-NVIDIA A100-PCIE-40GB配置pytorch1.10.0

报错分析:NVIDIA A100-PCIE-40GB 带有的CUDA算力是8.0,它和现有的PyTorch版本不匹配,现有的PyTorch版本支持的CUDA算力是 3.7,5.0,6.0,7.0,7.5。这里需要为NVIDIA A100-PCIE-40GB配置pytorch运行环境,已配置环境为。再重新运行pytorch代码,成功。将CUDA版本提高到11.0以上。,运行pytorch代码报错。

2023-08-15 15:59:37 2991

原创 论文解析-sciPENN

用这2个CITE-seq共有的protein作为训练集,分别将他们特有的protein作为测试集,评估sciPENN对CITE-seq数据集中缺失的protein丰度预测准确度。来自Seurat 4 的PBMC数据集,样本被注射水疱性口炎病毒 (VSV) 载体 HIV 疫苗,数据集包含每个样本注射疫苗0天、3天、7天的CITE-seq数据。PBMCs作为训练集,MALT作为测试集,利用scRNA-seq测试17个蛋白质表达水平。Monocyte:随机取4个样本作为训练集,剩余4个样本作为测试集。

2023-06-26 17:48:43 675 1

原创 Overleaf编译Latex报错:No PDF This compile didn’t produce a PDF

Overleaf有时候很奇怪,昨天还正常的项目,今天一打开就编译不成功了。主要有以下2个报错:1. No PDFThis compile didn’t produce a PDF2. TeX capacity exceeded, sorry [input stack size=10000]

2023-05-19 11:36:16 6231 1

原创 论文解析-单细胞和空间多组学的方法和应用综述

单细胞多组学技术一般通量高,一次测序一千个以上样本。单细胞多组学技术转录组+染色质可及性Smart3-ATAC等转录组+蛋白组CITE-seq等转录组+DNA甲基化scMT-seq等转录组+染色质相关抗原表位scSET-seq等DNA甲基化+染色质可及性scCOOL-seq等DNA甲基化+染色体信息snm3C-seq等染色质可及性+蛋白组ICICLE-seq等转录组+DNA甲基化+染色质可及性scNMT-seq等转录组+染色质可及性+蛋白组TEA-seq等。

2023-04-24 18:42:53 349

原创 论文解析-多模态单细胞数据对角整合综述

通过将真实的小数scRNA-seq数据集根据细胞分为两部分,模拟2种不同特征空间的模态数据。现有的对同细胞进行多组学测序的技术提供的少量数据集可以作为参考数据集,便于对角整合算法的模型训练与性能评估。下图是同一算法在考虑了共享特征后进行对角整合的结果,对所有颜色的细胞类型均有正确的对应关系。此时,可以构建这两个特征空间的相关矩阵,来表征一个模态中的特征可能与另一个模态的哪些特征相关。将不同模态数据融合到同一流行空间的前提是,认为不同模态数据产生于类似的分布或服从类似的过程,但现实测序过程并非如此,

2023-04-23 22:55:03 225

原创 VSCode配置R语言调试环境

https://www.cnblogs.com/linxiaoxu/p/16729570.html

2023-04-16 17:58:09 192

原创 必备网址-第三方包的用户手册

DGL 0.4.xDGL 0.8.x

2022-12-12 11:26:30 115

原创 win10安装VSCode及配置Python,R运行环境

措施:右键,从Command Palette指定python环境,输入python:select,换了python环境后还是报错。请教大神后,发现不安装radian也行,我跑了简单的R语句是可以正常运行的。因此,这里我暂时没有安装radian,以后有需要再说吧。注:最简单的,只安装R插件,就可用本地R解释器运行程序了。查过之后是vscode的python环境与我之前安装的conda python环境冲突了,radian安装到其他conda环境里了。直接下载会很慢,而且可能出现下载失败,网络错误等情况。

2022-12-09 13:13:31 1333

原创 环境配置:V100服务器配置Tensorflow1.13+Keras2.2.4

啊我突然发现conda吧我的cuda自动改成和tensorflow对应的版本了,所以conda应该是可以自动安装cuda的,踩坑踩坑。下次,无视cuda,直接conda install 需要的tensorflow版本即可。,发现没有cudnn=7.4,因此改为安装cudnn=7.6。

2022-12-08 20:33:59 800

原创 基因表达数据处理-Ensembl ID转化为Gene symbol

查询后似乎是ensembl.org网址不可用,该包也支持换其他数据库,但我这里没有再进行尝试。希望知道方法的大神帮忙指导。此处有33%Ensembl ID未找到对应Symbol。

2022-11-09 20:13:56 3408

原创 DNA计算

DNA计算领域利用DNA反应进行分子尺度的计算。DNA计算的大部分工作都是执行数字计算,如布尔电路的求值。本章概述了执行模拟计算的新型DNA计算方法,其中输入和输出是由特定DNA链的浓度指定的实数值。DNA碱基有四种类型:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶©和胸腺嘧啶(T)。A可以与T结合,G可以通过氢键与C结合。可编程自组装行为已被用于构建复杂的2D和3D DNA纳米结构和模式阵列。除了利用DNA复杂的结构,还可以用作纳米级计算的基础。DNA不仅可以实现简单的逻辑门,而且也可以实现非常复杂的逻辑电路。

2022-10-14 17:33:47 2736

原创 CNN改进

CNN改进ASPP(空洞空间金字塔池化)空洞卷积 VS 普通卷积ASPP结构参考ASPP(空洞空间金字塔池化)在这里插入图片描述空洞卷积 VS 普通卷积在Kernel size=3,Stride=1时:普通卷积感受野为33,每次移动一个像素,遍历卷积所有像素点;Hole size=2的空洞卷积感受野为55,虽然同为3*3卷积核,但空洞卷积每个卷积点间隔为Hole size,因此当Hole size=1时,空洞卷积与普通卷积相同;当Hole Size越大,空洞卷积的感受野越大。

2022-10-08 17:13:12 1407

原创 Linux系统用conda配置Seurat环境

安装Seurat时,我直接使用R进行安装,发现所选择的镜像似乎都不能正常安装,无奈采用 conda install -c r package-name的方式进行安装。seurat的安装方式是conda install -c conda-forge r-seurat。

2022-09-08 22:25:12 2296 2

原创 Seurat-单细胞数据预处理

Seurat4.0官方文档 https://satijalab.org/seurat/articles/pbmc3k_tutorial.html。

2022-09-08 17:21:33 1645

原创 论文解析-scMAGIC

同时,为了模拟不同程度的BatchEffect,分别考虑深度测序场景(Reference的scRNA-seq中平均每个细胞包含超过2500个基因,Smart-seq2等)代表小BatchEffect,低度测序场景(Reference的scRNA-seq中平均每个细胞包含低于650个基因,Seq-Well等)代表大BatchEffect。结果表明,LocalReference的Accuracy与最终预测结果的Accuracy正相关,可信度高的训练集导致准确的预测结果。scRNA-seq中行为基因,列为细胞。

2022-09-05 15:58:07 1013

原创 图表示学习-GraphEmbedding

GraphEmbedding方法根据图结构,生成新的节点特征,使相似度高的顶点拥有相似的Embedding。DeepWalk,LINE,SDNE,Struc2vec

2022-08-11 22:39:05 561

原创 图神经网络-GCN

图神经网络理解-GCN

2022-08-08 21:20:51 376

原创 论文解析-CCST-基于GNN的空间转录组聚类算法

因此,该人工注释的中间神经元细胞可以分为2个亚型,一个为可以与其他神经元交流的成熟功能性神经细胞,一个为与邻居细胞交互的未成熟细胞,主要进行定位和迁移。D为互信息,E表示由不同网络结构训练的模型,s为由正样本图结构训练的得到的整图特征(利用Readout函数由每个节点得到整图特征)计算邻居富集率对于一个类别的所有细胞,根据图结构收集每个细胞的邻居细胞,计算邻居细胞属于每个类别的占比,得到邻居富集率。本文通过Readout函数得到整图的特征,即通过聚合节点特征的方式来得到整图的特征表示。...

2022-07-24 15:42:50 2419

原创 文献调研-图神经网络改进算法

Chuxu Zhang, Dongjin Song, Chao Huang, Ananthram Swami, and Nitesh V. Chawla. 2019. Heterogeneous Graph Neural Network. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD '19). Association for Computing

2022-07-06 23:32:58 374

原创 深度学习环境配置避坑-CUDA11.0+DGL1.8

之前已经写过详细的CUDA+Pytorch+DGL安装博文了,Linux系统可参考这里,Windows系统可参考这里。本篇博文仅用于记录一些环境配置中可能遇到的坑,及避坑指南(本人亲亲测有效)报错:GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities s

2022-07-06 16:41:59 1916

原创 网卡驱动离线安装经验,避坑指南

网卡型号:Aquantia 10G Ethernet connectionwin10不联网离线安装

2022-06-27 23:53:05 7671 2

原创 文献调研-单细胞转录组与空间转录组联合分析Tangram

Biancalani, T., Scalia, G., Buffoni, L. et al. Deep learning and alignment of spatially resolved single-cell transcriptomes with Tangram. Nat Methods 18, 1352–1362 (2021). https://doi.org/10.1038/s41592-021-01264-7sc/snRNA-seq可以全面描述细胞,但缺少空间信息;空间转录组有空间信息,但

2022-06-24 16:16:14 1176 1

原创 文献调研-根据单细胞数据构建细胞/肿瘤进化树

Sadeqi Azer E, Haghir Ebrahimabadi M, Malikić S, Khardon R, Sahinalp SC. Tumor Phylogeny Topology Inference via Deep Learning. iScience. 2020;23(11):101655. Published 2020 Oct 7. doi:10.1016/j.isci.2020.101655主要解决3个问题:

2022-06-16 22:33:52 344

原创 图神经网络环境配置:Win11+CUDA10.2+Pytorch1.10+DGL

过程参考我另一篇博文,配置好numpy等其他依赖包。激活虚拟环境查询pytorch和对应CUDA进入Pytorch官网,根据需要的Pytorch和CUDA版本查看conda命令。此处我配置Pytorch1.10+CUDA10.2,命令为:运行太慢或网络连接失败,手动从以下4个网址查询需要的包,如果有则指定对应channel这里使用以下命令运行成功,注意必须http开头才能成功。虚拟环境下安装CUDA版本的DGL打开DGL官网,直接开可能会很慢,搭梯子之后明显变快了。根据CUDA版本获得对应

2022-06-14 15:44:50 2552 1

原创 Anaconda报错CondaHTTPError解决办法

检查配置文件进入”C:UsersAdministrator“,打开“.condarc“,将文件中内容改为以下内容:(注意:必须为http开头,不能是https开头)再次尝试创建Anaconda环境,成功。

2022-06-14 11:00:06 523 2

原创 论文解析:scRNA-seq结合空间转录组综述

Li, B., Zhang, W., Guo, C. et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods (2022). https://doi.org/10.1038/s41592-022-01480-9(1)gimVI:深度生成模型,推断未

2022-06-07 17:23:28 2513 1

原创 文献调研-利用深度学习模型基于scRNA-seq数据识别细胞亚型

Word2vec+LSTM参考X. Dong, S. Chowdhury, U. Victor, X. Li and L. Qian, “Semi-supervised Deep Learning for Cell Type Identification from Single-Cell Transcriptomic Data,” in IEEE/ACM Transactions on Computational Biology and Bioinformatics, doi: 10.1109/TCBB

2022-06-02 11:41:12 972

原创 论文解析-基于图卷积神经网络的癌症基因预测模型,利用LRP算法增加模型可解释性

论文解析:Integration of multiomics data with graph convolutional networks to identify new cancer genes and their associated molecular mechanisms参考论文概括方法数据收集模型构建模型可解释性(LRP)结果数据和代码参考论文Schulte-Sasse, R., Budach, S., Hnisz, D. et al. Integration of multiomics da

2022-05-31 17:02:33 2632

原创 超算云服务深度学习环境配置Pytorch1.6+CUDA10.2+DGL0.4.3

超算云服务深度学习环境配置登录超算云服务连接服务器1. 通过SSH连接服务器2. 通过第三方软件连接服务器(Xshell)配置深度学习环境1. 查看服务器已安装模块2. 调用Anaconda模块3. 创建Python3.7的虚拟环境4. 虚拟环境下安装CUDA10.2+Pytorch1.6.0

2022-05-18 16:54:08 6986 5

原创 神经网络入门-MLP, RNN, BiRNN

MLPMLP流程激活函数softmax函数包括输入层,若干隐藏层,输出层的多层全连接网络。整体流程:输入向量->线性关系(权重W,偏置b)->激活函数(sigmoid等)->隐藏层L1->线性关系->激活函数->隐藏层L2->…->输出层RNNRNN流程当前隐藏层St不仅由当前输入Xt决定,还受前一个隐藏层St-1影响BiRNNRNN,BiRNN,LSTM每一个隐藏层包括前向层和后向层,他们以不同权重作用于输出层。前向层St不仅

2020-07-24 15:33:53 597

原创 LeetCode6-Z字形变换

题目将一个给定字符串根据给定的行数numRows,以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 “LEETCODEISHIRING” 行数为 3 时,排列如下:之后,你的输出需要从左往右逐行读取,产生出一个新的字符串,比如:“LCIRETOESIIGEDHN”。思路利用长度为numRows的数组,第i个元素表示第i行包含的字符。利用flag控制Z字前进方向,如果当前在第一行或最后一行则改变Z字前进方向。代码class Solution: def convert(self,

2020-07-22 16:05:42 81 1

原创 LeetCode5-最长回文子串原理及Python实现

LeetCode5(medium)-最长回文子串题目给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。思路中心扩展法遍历字符串,依次把每个字符作为中心。中心为一个字符:中心一定是回文子串,如果左字符和右字符相同,那么扩展后的子串依然是回文子串。如果左字符和右字符不同,则扩展结束,记录当前回文子串位置。中心为两个字符:如果两字符相同,则中心是回文子串,进行后续扩展;如果两字符不同,则中心不是回文子串,不用进行后续扩展,子串长度为1.遍历结束,输出最长的

2020-07-18 14:24:14 155

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除