自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 单细胞分类和预测任务

除了上述方法和工具,还有一些特定领域的方法可以用于生物信息学中的分类和预测任务,如药物分子的定量构效关系(Quantitative Structure-Activity Relationship,QSAR)分析、蛋白质亚细胞定位预测等。根据具体的研究问题和数据特点,可以选择合适的方法和工具进行分类和预测任务。对于生物信息学领域的分类和预测任务,可以使用预训练的深度学习模型(如在ImageNet上预训练的模型)进行特征提取,然后在自己的数据集上进行微调。任务,在生物信息学领域有一些常用的方法和工具可以使用。

2023-08-07 00:56:45 527

原创 单细胞测序数据的降维方法和细胞亚型鉴定聚类方法

需要注意的是,降维方法和聚类方法只是单细胞转录组分析的一部分,还有其他的数据预处理、差异表达基因分析、细胞状态推断等步骤也是重要的。因此,在实际应用中,需要综合考虑多种方法和工具来进行全面的单细胞分析。此外,还有其他一些方法如Louvain算法、PhenoGraph等也可以用于细胞亚型鉴定聚类。这些方法的选择应根据数据的特点和分析的目标来决定。单细胞测序数据的降维方法和细胞亚型鉴定聚类方法是单细胞转录组分析中常用的技术。

2023-08-07 00:40:21 672

原创 单细胞测序基础知识

RNA-seq的每个组别一般需要设置2~3个重复,可以减少误差,这是由于RNA分子本身不稳定的性质决定的。图中每个点都代表一个样本,不同颜色表示不同类别,在绿色簇中,出现了一个红色样本,这个样本就是异常样本,需要进行剔除才能进行后续的分析。左侧表示下调的基因,右侧表示上调的基因。该数据集仅包含了X染色体的数据,方便测试,共12个样本,大约2G左右。上述所介绍的RNA为mRNA(信使RNA),还有一些非常规的RNA,每一行表示一个基因,单元格中颜色深浅表示表达量的高低。也可以对每个具体的通路做进一步分析。

2023-08-07 00:31:22 288

原创 R语言 tidyverse系列 学习笔记(系列6)数据分析 之 写入 导出 多个文件

R 中尽量避免使用 for loop。

2023-07-04 12:07:30 679

原创 R 语言 ggplot2 PCA 主成分分析(虚拟数据集)

该函数默认情况下以基因为列,样本为行,和我们创建的矩阵互为转置,因此需要用到转置函数。这里我们查看 PC1 的载荷得分,因为 PC1 解释原始数据的 93.6%的方差。先按 ggplot2 需要的方式格式化数据,x轴用第一个成分,y轴用第二个成分。取绝对值,再从小大到小排序,选取排名靠前的前十个基因top_10_genes。若想显示每个基因对应的 rotation,用以下代码即可,展示的是带正负值的。每一列表示一个基因所对应的10个样本,即一列只有十个数据。以上代码生成了100行基因,10列样本的矩阵。

2023-06-28 22:09:45 1055

原创 R语言 tidyverse系列学习笔记(系列5)dplyr 数据分析之across

当然,本例子中将 ID 列 和 gender 列 强制转换成 numeric 是不恰当的,只需要了解该方法即可。看一下结果,ID 列 和 gender 列 也输出为 pass or fail。有个缺点就是当需要计算的数据列过多时,需要一一列举很麻烦,用。新的问题来了,我的数据命名没有规律该怎么办呢?本系列继续以成绩单为例,对系列3进行改进。double属于numeric,可以用。,但是当数据量特别大时,会出现bug。可以根据数据类型来计算。

2023-06-14 09:07:23 993

原创 R语言 tidyverse系列学习笔记(系列4)PlantGrowth - percentage table

以上,我们就得到了需要的表格,现在将最后一条代码规整化并命名新的表名。即每行加起来为100%,但每列加起来不一定是100%将输出变成矩阵的形式,可以指定输出的 shape,用。数据有了,我们还缺少行名和列名,下面介绍一个快捷方式。统计 group 和 weight_cat 的次数。给数据集新加一列 weight_cat ,并用。拼接起来,结果有点奇怪,可以根据需求自定义修改。去掉了小数点,再把百分比数值前边加上。,再把百分比数值右边加上。先输出行名,在输出列名。加到我们需要的表格上。

2023-06-13 11:16:28 1275

原创 R语言 tidyverse系列学习笔记(系列3)具体任务的处理(成绩单为例)

以上代码看着些许累赘,我们只考虑原来的成绩决定 pass or fail 就会简单许多其中,.fns = c(curve = , pass = )表示两个function的名字.names=“{fn}_{col}”,{fn}表示.fns里新加的两个名字。

2023-06-05 17:14:07 639

原创 R语言 tidyverse系列学习笔记(系列2)表格的处理

这段代码是在 R 语言中生成一个长度为 9 的随机数向量,向量中的每个元素都是在 80 到 90 之间的均匀分布的随机数,并使用。因此,这段代码生成的向量中的每个元素都是 80 到 90 之间的整数。最难满足的条件放在最前边,最容易满足的条件放在最后。设置最后一个数据为缺失值,用 NA 表示。有 n 这个参数,可以更灵活控制输出。函数用于生成均匀分布的随机数,逐个输入想要的列太浪费时间,用。参数指定保留的小数位数,而。只保留男生女生的最高分,可以用。···当列数很多时,筛选包含某关键词的列。

2023-06-05 14:10:53 548

原创 R语言 tidyverse系列学习笔记(系列1)基础功能的代码实现

数据集有150个对象(observation),5列 ( Sepal.Length , Sepal.Width , Petal.Length , Petal.Width , Species )数据太多,只想看一部分可以用 head 和 tail ,默认展示 6 个 observations。tidyverse 译 “洁净的宇宙” => “极乐净土”想展示12行,设定展示的行数为12即可。** 查看维度dimention**** 添加 id 列**** 取 行 数据**** 查看数据集**

2023-06-04 17:38:02 644

原创 用户项目二部图的个性化推荐参考资料

推荐系统二部图

2022-10-26 09:42:18 701 1

原创 conda 配置 pip 里 proceed 时 自动 yes 方法

【代码】还在每次都在命令行proceed里输入y吗,来copy自动yes方法。

2022-10-18 09:53:33 700

原创 在线薅 达摩院-人工智能训练师(高级)证书

人工智能训练师(高级)

2022-10-12 09:54:29 2521 1

原创 unsampling和unpooling,上采样下采样

上下采样简述

2022-10-08 21:36:17 257

原创 latex模板列出所有参考文献并加上超链接(xiaoming et al. 2022; xiaohong et al. 2021)

列出所有参考文献 加超链接

2022-08-07 18:01:20 3515

原创 latex模板Springer标题的一些问题

latex模板Springer标题的一些问题。

2022-08-07 17:15:44 2310

原创 anaconda修改安装目录

实验室的服务器ubuntu系统,anaconda之前安装在了主目录里,最近出现了空间不足的情况,代码也老是卡死,故想将anaconda3迁移到别的位置,查了很多资料,大家可以看下这两个参考链接。

2022-07-29 14:29:41 2341 1

原创 Latex模板elsevier爱思唯尔KBS投稿步骤

祝 accept2.选择文章类型我选的 full length article3.Attach Files必填项可以去搜一下,都有模板,Elsevier作者指南都有超链接,可以直接看例子,或者去期刊官网看看其他论文怎么写的(比如 highlights)检查一下是不是都上传对了{Author Agreement, Cover Letter, Credit Author Statement, Declaration of Interest S

2022-05-07 15:19:56 20427 36

原创 latex模板KBS投稿编译PDF出错

在 view submission 这里查看生成的PDFmanuscript 显示乱码这是因为我们没有正确导入源文件或者缺少源文件我们将 tex, bib, bst, sty, cls,以及 pdf 文件(我的图片都是用的pdf,最好格式统一)都以 menuscript 类型上传,之前编译失败就是因为上传到 latex source file 里了。修改类型之后,就编译成功了提交之前一定要仔细检查一遍祝accept...

2022-05-07 14:33:46 2090

原创 Latex overleaf 图表公式参考文献

1. 图以 visio 图为例,随便画个图visio左上角,文件->导出->pdf格式将 test.pdf 上传,下边这几行代码就能将图片上传上来,根据自己的需求修改。\begin{figure}\centering\includegraphics[width=1\textwidth]{test.pdf}\caption{\label{fig:test}This is a test figure.}\end{figure}2. 表格首先推荐一个在线表格生成latex

2022-01-03 01:22:28 2310 2

原创 顶会常见的 python matplotlib 双Y轴柱状图

效果图:代码如下:import matplotlib.pyplot as pltimport numpy as npx_data = ['1','2','3']ax_data = [16,28,33]ax1_data = [7,8,9]fig=plt.figure()ax=fig.add_subplot(111)ax.set_ylim([15,35])ax.set_yticks=np.arange(15,35)ax.set_yticklabels=np.arange(15,35

2021-12-27 16:46:24 4457

原创 新环境安装torch_scatter报错

常用whl下载地址很全的链接: link.torch_scatter链接: link.torch链接: link.shift+右键 —> 在此处打开powershell窗口 —> start cmd —> 进入conda即可(建议用虚拟环境,而不是base环境)要安装 scipy 这个 whl 文件的话,输入 s 之后按下 tab 键可以自动补全同理,其他的 whl 文件也是这样安装在 pycharm 里运行就不会报错啦还有一种安装方法打开anaconda pro

2021-09-05 10:47:38 365

原创 linux环境安装docker,下载集群镜像,封装镜像,上传镜像

安装docker教程:https://www.cnblogs.com/blog-rui/p/11244023.htmldocker命令:https://blog.csdn.net/sazass/article/details/115027209smc上传镜像:https://blog.csdn.net/sazass/article/details/1187281160 登录集群 :sudo docker login 10.16.63.47:8888 输入账号密码之后 login s

2021-08-20 22:00:09 406

原创 Learning Intents behind Interactions with Knowledge Graph for Recommendation学习笔记

背景知识图谱(KG)在提高推荐的准确性和可解释性方面显示出巨大的潜力。KG中丰富的实体和关系信息可以补充用户和项目之间的关系建模。它们不仅揭示了项目之间的各种关联性(例如,由一个人共同导演的电影),而且还可以用于解释用户偏好(例如,将用户对电影的选择归因于其导演)。最近的技术趋势是开发基于图形神经网络的端到端模型。关键思想是利用信息聚合方案,它可以有效地将多跳邻居集成到表示中。从连接建模和表示学习的集成中受益,这些基于GNN-based的模型实现了有希望的推荐性能。 然而,现有的基于GNN的模型在关系

2021-06-25 19:59:18 1009

原创 conda查看py2neo,neo4j-driver版本

C:\Users\XXX>conda activate graph(graph) C:\Users\XXX>pip show py2neoName: py2neoVersion: 2021.0.1Summary: Python client library and toolkit for Neo4jHome-page: https://py2neo.org/Author: Nigel SmallAuthor-email: py2neo@nige.techLicense: Ap.

2021-03-13 16:37:55 1891

原创 neo4j安装,jdk安装,环境变量配置

JDK安装:https://www.oracle.com/cn/java/technologies/javase-downloads.htmlNeo4j安装:https://neo4j.com/download-center/安装社区版就可以。配置neo4j和jdk的环境。此电脑–属性–高级系统设置–环境变量–系统变量新建一个NEO4J_HOME,变量值为安装路径。Path里新增两条路径一个是jdk的安装目录的bin一个是刚刚新建环境变量的bincmd输入 java -ver

2021-03-13 16:17:02 1189 1

原创 anaconda pycharm py2neo neo4j

在pycharm里安装py2neo库老是安装失败问题。问题就不详细阐述了。解决方案:first:上图python=自己安装的版本。pip install XXXX -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com安装完成后,退出虚拟环境graphsecond:打开pycharm,打开项目设置:选add这样就不报错了over~...

2021-03-08 21:20:29 1255 2

原创 知识图谱入门的论文网站小知识点

知识图谱是结构化的语义知识库,本质上是语义网络(Semantic Network)的知识库,用于迅速描述物理世界中的概念及其相互关系。它通过对错综复杂的文档的数据进行有效的加工、处理、整合来转化为简单、清晰的“实体,关系,实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。三元组是知识图谱的基本单位。知识图谱有自顶向下和自底向上两种构建方式。如果两个节点之间存在关系,他们就会被一条无向边连接在一起,那么这个节点,我们就称为实体(Entity),它们之间的这条边,我们就称为关系(Relati

2021-02-27 21:01:48 351

原创 pytorch处理多维特征的输入

torch.nn.Linear(输入维度,输出维度)上图实现了8维到1维的转换。import numpy as npxy=np.loadtxt("diabetes.csv.gz",delimiter=",",dtype=np.float32)x_data=torch.from_numpy(xy[:,:-1])y_data=torch.from_numpy(xy[:,[-1]])#取出来的是矩阵,-1不加【】就是向量import torch class Model(torch.nn.Mo..

2021-02-24 13:36:59 523

原创 逻辑斯蒂回归pytorch

sigmoid functions:tanh(x)在lstm里经常使用。上图中最常用的就是逻辑斯蒂回归函数:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。import torch x_data=torch.Tensor([[1.0],[2.0],[3.0]])y_data=torch.Tensor([[0],[0],[1]])class LogisticRegressionModel(torc

2021-02-19 22:00:39 168

原创 用pytorch实现线性回归

一.准备数据集先看公式:所以,在写代码时,x,y要定义为矩阵。模型要定义成一个继承自nn.Module的类:二.使用类设计模型call:args & kwargs三.构造损失和优化器四.训练周期**此处笔者有个小错误,输出应该是loss.item(),不然输出结果就如下图所示。运行结果:迭代了100次,还没有收敛,可以再多迭代几轮,也不要太多,以免模型过拟合。整体代码:import torchx_data=torch.Tensor([[1.0

2021-02-18 17:01:37 196

原创 反向传播pytorch

如图所示,5维的x需要转变成6维的H,需要6*5=30个权重。以下同理,所以这是一个非常大的工作量。两层神经网络计算公式:非线性函数,sigmoid函数找公式的网站:cn.bing.com国内版,找matrix cookbook这本书就可以了。反馈计算:l.backward()是个tensor类型,为了避免构建计算图,所以需要用.data计算。...

2021-02-17 21:29:59 124

原创 梯度下降,随机梯度下降,代码实现

梯度下降:分治法—可能会错过更好的取值。如果数据集或者维度大,代价也大。

2021-02-16 22:43:13 1871

原创 线性模型pytorch

此处感谢刘二大人的视频,我也简要做了下笔记供后续学习。线性模型import numpy as npimport matplotlib.pyplot as pltx_data=[1.0,2.0,3.0]y_data=[2.0,4.0,6.0]def forward(x): return x*wdef loss(x,y): y_pred=forward(x)#y_hat return (y_pred-y)*(y_pred-y)w_list=[]mse_li

2021-02-16 18:47:40 75

原创 pytorch安装

先进官网https://pytorch.org/根据自己的需求选择之后会出现最下边的安装指令,在cmd里运行下载安装包。安装完成后,我们输入指令试试有没有安装成功。看一看到conda没有激活,我们根据提示去https://conda.io/activation看一下。...

2021-02-16 18:42:05 72

原创 NLP Bert模型

简介Word Embedding把词语映射为“语义”空间上的点。1.Word2Vec两个词上下文相似,那么它们的语义也相似。1.CBOW:Context预测中心词2.Skip-Gram:中心词预测Context2.GloVeVanilla RNN(原始循环神经网络):用梯度下降或者反向传播算法来实现将loss或者error逐层往前传递。由于梯度消失问题,原始RNN很难学到长距离的依赖关系。顺序依赖,无法并行。RNN改进和扩展1.LSTM/GRU语义是上下文相关的,RNN

2021-01-24 21:32:44 200

原创 基于pytorch和NLP的聊天机器人

聊天机器人的行业背景为什么学?1.热门行业(NLP主流方向)2.技术流,主流Seq2Seq+Attention3.前沿,行业内缺乏大量人才4.薪资高,贴近生活一、聊天机器人综合介绍具代表性的有;腾讯QQ小冰,天猫精灵等不刻板不生硬应用场景:自动回复,医疗,旅游,餐饮,财经,新闻等起源发展:诞生于20世纪80年代,用来模拟人类对话或者聊天的程序。1966年诞生的Eliza和1972年诞生的Parry是早期非常著名的聊天机器人。分类;&检索模式:预定义响应 的数据库和某种启发式推

2021-01-22 21:48:41 1459

原创 神经网络前向后向传播的一些小问题unsupported operand type(s) for *: ‘int‘ and ‘NoneType‘ site:blog.csdn.net

如图所示,我们要用代码实现前向后向传播。#定义一个乘法类class MulLayer:def init(self):self.x=Noneself.y=None#定义前向传播函数def forward(self,x,y): self.x=x self.y=y out=x*y return out #定义反向传播函数def backward(self,dout): dx1=dout*self.y dy1=dout*self.x .

2020-11-24 20:13:49 440 2

原创 BI-LSTM,BILSTM-CRF,Lattice-LSTM基本原理以及在NER中的应用

BI-LSTM,BILSTM-CRF,Lattice-LSTM基本原理以及在NER中的应用连大赵露思喜欢这篇文章可以关注公众号GoAI哟,都是感兴趣的在读研究生共同经营的,目前已收录计算机视觉和NLP的文章多篇目录:①BI-LSTM,BILSTM-CRF,Lattice-LSTM的基本原理②BI-LSTM,BILSTM-CRF,Lattice-LSTM在NER中的作用BI-LSTM,BILSTM-CRF,Lattice-LSTM的基本原理BI-LSTM:LSTM(long-short ter

2020-11-22 16:27:29 5187

原创 Java

2020—2---24删除之前的版本,下载了老师给的安装包。安装jdk更改安装目录安装jre,放到jdk的同级目录里安装完成后,检查一下jdk是否安装成功在jdk的bin目录下新建文本文件,后缀改成 .java编辑程序windows+r , 输入cmd,打开dos窗口进入jdk安装目录下的bin目录输入javac屏幕输出帮助信息即安装成功完成若修改了文件...

2020-02-24 14:17:20 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除