来份芒果布丁-CSDN博客

原创单细胞分类和预测任务

除了上述方法和工具，还有一些特定领域的方法可以用于生物信息学中的分类和预测任务，如药物分子的定量构效关系（Quantitative Structure-Activity Relationship，QSAR）分析、蛋白质亚细胞定位预测等。根据具体的研究问题和数据特点，可以选择合适的方法和工具进行分类和预测任务。对于生物信息学领域的分类和预测任务，可以使用预训练的深度学习模型（如在ImageNet上预训练的模型）进行特征提取，然后在自己的数据集上进行微调。任务，在生物信息学领域有一些常用的方法和工具可以使用。

2023-08-07 00:56:45 747

原创单细胞测序数据的降维方法和细胞亚型鉴定聚类方法

需要注意的是，降维方法和聚类方法只是单细胞转录组分析的一部分，还有其他的数据预处理、差异表达基因分析、细胞状态推断等步骤也是重要的。因此，在实际应用中，需要综合考虑多种方法和工具来进行全面的单细胞分析。此外，还有其他一些方法如Louvain算法、PhenoGraph等也可以用于细胞亚型鉴定聚类。这些方法的选择应根据数据的特点和分析的目标来决定。单细胞测序数据的降维方法和细胞亚型鉴定聚类方法是单细胞转录组分析中常用的技术。

2023-08-07 00:40:21 1571

原创单细胞测序基础知识

RNA-seq的每个组别一般需要设置2～3个重复，可以减少误差，这是由于RNA分子本身不稳定的性质决定的。图中每个点都代表一个样本，不同颜色表示不同类别，在绿色簇中，出现了一个红色样本，这个样本就是异常样本，需要进行剔除才能进行后续的分析。左侧表示下调的基因，右侧表示上调的基因。该数据集仅包含了X染色体的数据，方便测试，共12个样本，大约2G左右。上述所介绍的RNA为mRNA（信使RNA），还有一些非常规的RNA，每一行表示一个基因，单元格中颜色深浅表示表达量的高低。也可以对每个具体的通路做进一步分析。

2023-08-07 00:31:22 811

原创 R语言 tidyverse系列学习笔记（系列6）数据分析之写入导出多个文件

R 中尽量避免使用 for loop。

2023-07-04 12:07:30 915

原创 R 语言 ggplot2 PCA 主成分分析（虚拟数据集）

该函数默认情况下以基因为列，样本为行，和我们创建的矩阵互为转置，因此需要用到转置函数。这里我们查看 PC1 的载荷得分，因为 PC1 解释原始数据的 93.6%的方差。先按 ggplot2 需要的方式格式化数据，x轴用第一个成分，y轴用第二个成分。取绝对值，再从小大到小排序，选取排名靠前的前十个基因top_10_genes。若想显示每个基因对应的 rotation，用以下代码即可，展示的是带正负值的。每一列表示一个基因所对应的10个样本，即一列只有十个数据。以上代码生成了100行基因，10列样本的矩阵。

2023-06-28 22:09:45 1703

原创 R语言 tidyverse系列学习笔记（系列5）dplyr 数据分析之across

当然，本例子中将 ID 列和 gender 列强制转换成 numeric 是不恰当的，只需要了解该方法即可。看一下结果，ID 列和 gender 列也输出为 pass or fail。有个缺点就是当需要计算的数据列过多时，需要一一列举很麻烦，用。新的问题来了，我的数据命名没有规律该怎么办呢？本系列继续以成绩单为例，对系列3进行改进。double属于numeric,可以用。，但是当数据量特别大时，会出现bug。可以根据数据类型来计算。

2023-06-14 09:07:23 1293

原创 R语言 tidyverse系列学习笔记（系列4）PlantGrowth - percentage table

以上，我们就得到了需要的表格，现在将最后一条代码规整化并命名新的表名。即每行加起来为100%，但每列加起来不一定是100%将输出变成矩阵的形式，可以指定输出的 shape，用。数据有了，我们还缺少行名和列名，下面介绍一个快捷方式。统计 group 和 weight_cat 的次数。给数据集新加一列 weight_cat ，并用。拼接起来，结果有点奇怪，可以根据需求自定义修改。去掉了小数点，再把百分比数值前边加上。，再把百分比数值右边加上。先输出行名，在输出列名。加到我们需要的表格上。

2023-06-13 11:16:28 1553

原创 R语言 tidyverse系列学习笔记（系列3）具体任务的处理（成绩单为例）

以上代码看着些许累赘，我们只考虑原来的成绩决定 pass or fail 就会简单许多其中，.fns = c(curve = , pass = ）表示两个function的名字.names=“{fn}_{col}”，{fn}表示.fns里新加的两个名字。

2023-06-05 17:14:07 821

原创 R语言 tidyverse系列学习笔记（系列2）表格的处理

这段代码是在 R 语言中生成一个长度为 9 的随机数向量，向量中的每个元素都是在 80 到 90 之间的均匀分布的随机数，并使用。因此，这段代码生成的向量中的每个元素都是 80 到 90 之间的整数。最难满足的条件放在最前边，最容易满足的条件放在最后。设置最后一个数据为缺失值，用 NA 表示。有 n 这个参数，可以更灵活控制输出。函数用于生成均匀分布的随机数，逐个输入想要的列太浪费时间，用。参数指定保留的小数位数，而。只保留男生女生的最高分，可以用。···当列数很多时，筛选包含某关键词的列。

2023-06-05 14:10:53 671

原创 R语言 tidyverse系列学习笔记（系列1）基础功能的代码实现

数据集有150个对象（observation），5列 ( Sepal.Length , Sepal.Width , Petal.Length , Petal.Width , Species )数据太多，只想看一部分可以用 head 和 tail ，默认展示 6 个 observations。tidyverse 译 “洁净的宇宙” => “极乐净土”想展示12行，设定展示的行数为12即可。** 查看维度dimention**** 添加 id 列**** 取行数据**** 查看数据集**

2023-06-04 17:38:02 987

原创用户项目二部图的个性化推荐参考资料

推荐系统二部图

2022-10-26 09:42:18 888

原创 conda 配置 pip 里 proceed 时自动 yes 方法

【代码】还在每次都在命令行proceed里输入y吗，来copy自动yes方法。

2022-10-18 09:53:33 993

原创 unsampling和unpooling，上采样下采样

上下采样简述

2022-10-08 21:36:17 370

原创 latex模板列出所有参考文献并加上超链接（xiaoming et al. 2022； xiaohong et al. 2021）

列出所有参考文献加超链接

2022-08-07 18:01:20 4078

原创 latex模板Springer标题的一些问题

latex模板Springer标题的一些问题。

2022-08-07 17:15:44 3368

原创 anaconda修改安装目录

实验室的服务器ubuntu系统，anaconda之前安装在了主目录里，最近出现了空间不足的情况，代码也老是卡死，故想将anaconda3迁移到别的位置，查了很多资料，大家可以看下这两个参考链接。

2022-07-29 14:29:41 2680 1

原创 Latex模板elsevier爱思唯尔KBS投稿步骤

祝 accept2.选择文章类型我选的 full length article3.Attach Files必填项可以去搜一下，都有模板，Elsevier作者指南都有超链接，可以直接看例子，或者去期刊官网看看其他论文怎么写的（比如 highlights）检查一下是不是都上传对了{Author Agreement, Cover Letter, Credit Author Statement, Declaration of Interest S

2022-05-07 15:19:56 27468 40

原创 latex模板KBS投稿编译PDF出错

在 view submission 这里查看生成的PDFmanuscript 显示乱码这是因为我们没有正确导入源文件或者缺少源文件我们将 tex, bib, bst, sty, cls,以及 pdf 文件（我的图片都是用的pdf，最好格式统一）都以 menuscript 类型上传，之前编译失败就是因为上传到 latex source file 里了。修改类型之后，就编译成功了提交之前一定要仔细检查一遍祝accept...

2022-05-07 14:33:46 3514 4

原创 Latex overleaf 图表公式参考文献

1. 图以 visio 图为例，随便画个图visio左上角，文件->导出->pdf格式将 test.pdf 上传，下边这几行代码就能将图片上传上来，根据自己的需求修改。\begin{figure}\centering\includegraphics[width=1\textwidth]{test.pdf}\caption{\label{fig:test}This is a test figure.}\end{figure}2. 表格首先推荐一个在线表格生成latex

2022-01-03 01:22:28 2945 2

原创顶会常见的 python matplotlib 双Y轴柱状图

效果图：代码如下：import matplotlib.pyplot as pltimport numpy as npx_data = ['1','2','3']ax_data = [16,28,33]ax1_data = [7,8,9]fig=plt.figure()ax=fig.add_subplot(111)ax.set_ylim([15,35])ax.set_yticks=np.arange(15,35)ax.set_yticklabels=np.arange(15,35

2021-12-27 16:46:24 5839 1

原创新环境安装torch_scatter报错

常用whl下载地址很全的链接: link.torch_scatter链接: link.torch链接: link.shift+右键 —> 在此处打开powershell窗口 —> start cmd —> 进入conda即可（建议用虚拟环境，而不是base环境）要安装 scipy 这个 whl 文件的话，输入 s 之后按下 tab 键可以自动补全同理，其他的 whl 文件也是这样安装在 pycharm 里运行就不会报错啦还有一种安装方法打开anaconda pro

2021-09-05 10:47:38 503

原创 linux环境安装docker，下载集群镜像，封装镜像，上传镜像

安装docker教程：https://www.cnblogs.com/blog-rui/p/11244023.htmldocker命令：https://blog.csdn.net/sazass/article/details/115027209smc上传镜像：https://blog.csdn.net/sazass/article/details/1187281160 登录集群：sudo docker login 10.16.63.47:8888 输入账号密码之后 login s

2021-08-20 22:00:09 571

原创 Learning Intents behind Interactions with Knowledge Graph for Recommendation学习笔记

背景知识图谱(KG)在提高推荐的准确性和可解释性方面显示出巨大的潜力。KG中丰富的实体和关系信息可以补充用户和项目之间的关系建模。它们不仅揭示了项目之间的各种关联性(例如，由一个人共同导演的电影)，而且还可以用于解释用户偏好(例如，将用户对电影的选择归因于其导演)。最近的技术趋势是开发基于图形神经网络的端到端模型。关键思想是利用信息聚合方案，它可以有效地将多跳邻居集成到表示中。从连接建模和表示学习的集成中受益，这些基于GNN-based的模型实现了有希望的推荐性能。然而，现有的基于GNN的模型在关系

2021-06-25 19:59:18 1390

原创 conda查看py2neo,neo4j-driver版本

C:\Users\XXX>conda activate graph(graph) C:\Users\XXX>pip show py2neoName: py2neoVersion: 2021.0.1Summary: Python client library and toolkit for Neo4jHome-page: https://py2neo.org/Author: Nigel SmallAuthor-email: py2neo@nige.techLicense: Ap.

2021-03-13 16:37:55 2157

原创 neo4j安装，jdk安装，环境变量配置

JDK安装：https://www.oracle.com/cn/java/technologies/javase-downloads.htmlNeo4j安装：https://neo4j.com/download-center/安装社区版就可以。配置neo4j和jdk的环境。此电脑–属性–高级系统设置–环境变量–系统变量新建一个NEO4J_HOME,变量值为安装路径。Path里新增两条路径一个是jdk的安装目录的bin一个是刚刚新建环境变量的bincmd输入 java -ver

2021-03-13 16:17:02 1571 1

原创 anaconda pycharm py2neo neo4j

在pycharm里安装py2neo库老是安装失败问题。问题就不详细阐述了。解决方案：first:上图python=自己安装的版本。pip install XXXX -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com安装完成后，退出虚拟环境graphsecond:打开pycharm,打开项目设置：选add这样就不报错了over~...

2021-03-08 21:20:29 1534 2

原创知识图谱入门的论文网站小知识点

知识图谱是结构化的语义知识库，本质上是语义网络（Semantic Network）的知识库，用于迅速描述物理世界中的概念及其相互关系。它通过对错综复杂的文档的数据进行有效的加工、处理、整合来转化为简单、清晰的“实体,关系,实体”的三元组，最后聚合大量知识，从而实现知识的快速响应和推理。三元组是知识图谱的基本单位。知识图谱有自顶向下和自底向上两种构建方式。如果两个节点之间存在关系，他们就会被一条无向边连接在一起，那么这个节点，我们就称为实体（Entity），它们之间的这条边，我们就称为关系（Relati

2021-02-27 21:01:48 655

空空如也

空空如也