自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xuzhougeng blog

徐洲更的第二大脑

  • 博客(710)
  • 资源 (4)
  • 收藏
  • 关注

原创 使用ShinyCell展示你的单细胞数据

在我参与发表我的第一篇植物单细胞文章中,我用Shiny开发了一个简单的单细胞可视化网站,目前已经运行了5年了,有上万的访问,唯一的不足就是太简陋。然后,你读取你分析得到的Seurat文件,注意readySeu_rset.rds对应的是你使用Seura分析得到,并保存的Rds数据。接着,将输出的文件夹,例如shinyApp移动到/srv/shiny-server目录下, 你就可以通过浏览器访问对应的项目了,例如 http://服务器地址:3838/shiny-server。

2024-06-14 22:11:23 310

原创 GSEA的算法只考虑排序吗

其实是考虑排序的哦

2024-06-03 17:03:34 356

原创 写在Cell上线时

我参与的Cell终于上线了,开心~

2024-06-03 16:58:24 358 1

原创 关于基因结构注释,我的一些折腾和思考

兜兜转转,轮旋上升

2024-02-08 18:19:24 685 1

原创 miniprot:更快的蛋白比对基因组工具

在做基因组注释时,有些时候需要将近源物种的蛋白序列回帖到基因组上,之前用到GeneWise或者Exonerate,但是这两个工具的岁数都太大了,且速度也不够快。好在,李恒团队出手了,开发了miniprot,从命名上,就知道他会跟minimap一样高效,好用。这里的ref.fna是参考基因组序列。之所以要这样子做,是因为miniprot需要将基因组翻译成氨基酸序列,这一部分比较费时间。输出的gff文件就可以直接用IGV进行可视化,或者用其他软件解析,作为下游分析的输入。安装非常简单,仅依赖于zlib。

2024-01-10 09:34:35 955 3

原创 ChatGPT给出最有用建议居然是去网上搜索

但是,我装了下,发现没问题啊,然后,我就问他,他是哪里加载的,他回答的说,是在Rstduio-server上。,我按照他的要求做了,然后我用管理员成功的为全局装了xlsx,并且在终端测试也可以,于是我让学员继续试试,结果安装没问题,加载出问题了。我觉得事情没有那么简单,一定是哪里出错了,于是我把我自作聪明复制粘贴的文件都删了,开始问GPT。我一看,没找到libjvm.so而已,简单,于是我取巧的直接把这些共享文件,复制到了。我觉得此时有蹊跷,于是,我赶紧上了服务器做测试,首先安装的时候,提有如下的提示。

2024-01-10 09:32:32 510 1

原创 irlba::irlba(mat, nDimensions, nDimensions): function ‘as_cholmod_sparse‘ not provided by package ‘

原因很简单,Seurat版本高了,Matrix和irlba版本没跟上。先重启R或者Rstudio。

2023-12-13 21:34:32 2066 1

原创 让GPT替我写vue3代码,看的我血压升高

语言模型,每次都是输出他认为概率最大的一个

2023-10-30 15:25:34 995

原创 什么年代了,还在用FastQC?试试Falco吧

Falco可以直接替代FastQC

2023-10-24 11:53:26 377 1

原创 SRA数据下载的一个坑

SRA数据真坑啊!

2023-07-16 13:55:22 1181 1

原创 如何下载SRA存放在AWS的原始数据

SRA数据真的是太让人糟心了

2023-07-16 13:53:38 2624 3

原创 Windows基于WSL搭建Python数据分析环境

最近配置了一台较为不错的台式机,记录下自己配置环境的过程。安装WSL,提供Linux环境如果你发现后续的命令无法运行或者说软件商城中找不到,这可能意味着你的操作系统不符合要求。WSL安装要求 Windows 10 version 2004(Build 19041 )及以上,或者是Windows11.以管理员身份(也就是右击命令提示符)打开Windows下的CMD或PowerShell(后续,我们统一称之为终端)然后终端中,执行如下命令wsl --install中间可能会出现几次弹窗,需要

2023-07-03 17:46:48 2291

原创 配置pytorch(gpu)分析环境

Pytorch是目前最火的深度学习框架之一,另一个是TensorFlow。不过我之前一直用到是CPU版本,几个月前买了一台3070Ti的笔记本(是的,我在40系显卡出来的时候,买了30系,这确实一言难尽),同时我也有一台M1芯片Macbook Pro,目前也支持了pytorch的GPU加速,所以我就想着,在这两个电脑上装个Pytorch,浅度学习深度学习。

2023-04-05 10:09:55 2408 7

原创 从源码角度看R语言的format函数

真正把控结果展示,而不迷迷糊糊

2023-04-01 17:01:09 926

原创 我跟GPT合作写了一个genbank文件处理的脚本

和GPT共事写一个脚本

2023-03-28 22:19:17 1037

原创 使用GPT让你的RStudio如虎添翼

让RStudio更好用

2023-02-14 15:18:45 3653 5

原创 告别3D-DNA试试chromap和yahs做Hi-C辅助组装吧

是时候告别3d-DNA了

2023-01-27 10:41:01 5047 3

原创 旧版本Ubuntu安装magick出现undefined symbol的解决思路

从18年后再也没如此费力的处理这个问题了

2022-12-11 20:03:40 1232

原创 chatGPT会替代程序员吗?

它是我们的好帮手,但替代程序员,还需要一段时间吧

2022-12-06 16:00:50 5319 4

原创 在shell脚本里面调用conda创建的环境

推荐用conda run

2022-11-21 09:08:25 3421

原创 R如何正确动态创建变量名,解决target of assignment expands to non-language object

在一个群里,看到一位朋友发了一堆代码,错误代码以及一个报错信息,Error in paste(.....) :could not find function "paste←" (还有一个target of assignment expands to non-language object)他非常不理解,为什么,明明paste的用法没错,sum的操作也没有错,但是代码却出错了呢?这...

2022-11-03 11:11:52 361

原创 【R】如何合适的动态创建变量名

动态创建变量名的最好方式,应该就是列表了。

2022-11-03 11:09:12 743

原创 从一则12年前的提问中学习:从配对序列联配到多序列联配

优秀的提问和很有用的回答

2022-10-21 21:55:05 604

原创 使用jcvi绘制微共线性(Microsynteny)

JCVI画图真好看!

2022-10-20 13:15:38 2958

原创 计算分子进化-搞懂PAML的正选择分析

努力搞懂基因正选择分析背后的原理

2022-08-31 11:29:30 5064 3

原创 log化的TPM能做差异分析吗

能,但是看统计方法

2022-06-28 15:28:02 9694 1

原创 服务器上R调用png显示x11报错怎么办?

太长不读版- 治本的方法,服务器安装pango, 之后重新编译R语言- 治标的方法,在R的配置文件中增加`options(bitmapType='cairo')`

2022-06-28 15:26:36 2064

原创 尝试了一个自然语言模型BLOOM

可以和GPT-3匹配的模型

2022-06-28 15:11:04 3615

原创 使用非负最小二乘回(NNLS)归进行细胞类型转移

2019年发表在Nature上的文章【The single-cell transcriptional landscape of mammalian organogenesis】在方法部分提到,使用NNLS(non-negative linear-square)回归的方法分析两个细胞图谱数据集中相关细胞类型。这个方法,在我搜索的中文教程中都没有出现过,所以这里以两个pbmc的数据集为例进行介绍,如何复现文章的方法。10x的细胞数据集的预处理部分不做过多介绍, 如下代码以10x官网提供的数据为例libra

2022-03-29 09:21:13 3104 1

原创 macOS的configd占了我好多内存

在我没有启动多少应用的时候,macOS已经显示它使用了22.09GB内存。其中App内存是15.81GB, 我并没有打开那么多App.这估计跟configd有关,因为configd占用了20.55G内存。那么configd是真的占用了内存,还是就是声明自己会用到那么多内存呢?我尝试着调用了比较多的内存,直接用了29.3Gb内存cols <- 8189rows <- 320127mat1 <- matrix(data = 0, nrow=320127, ncol = 8189)

2022-02-27 10:06:01 4353 1

原创 MacOS的ARM64的R如何解决编译问题

处理gsl-config not found, lzma.h not found 的系列报错问题

2022-02-21 18:04:44 1149

原创 我的生信自学心得分享

我的生信心得分享

2022-02-16 22:29:33 4458 3

原创 对水稻的注释进行了二次整理

代码和数据都在GitHub上,见 https://github.com/xuzhougeng/rice_annotaiton

2022-02-15 21:05:22 2206

原创 SSH如何免密登录服务器

最近切换到了MacOS平台进行办公,就不能用Windows下好用的XShell,用上了传统在命令行输入 ssh -p port user@address的方式进行登录了。作为一个‘懒惰’的人,我肯定是要避免重复的运行登录命令了。回溯用过的命令进行复用是一种方式,但还是需要输入密码,所以我的操作方式如下第一步: 通过编辑 ~/.ssh/config文件, 为指定服务器增加别名Host 别名 HostName 服务器地址 User 用户名 Port 端口这样子就能用 ssh 目

2022-02-10 10:05:37 20009

原创 ARM架构的MacOS如何配置R语言分析环境

去年11月换了一台16寸Macbook Pro,用上了苹果自己开发的arm架构的M1芯片。换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时做一期视频教程了。本篇内容是视频教程的概要,详细版见视频。第一步,安装R语言,目前推荐Intel版本的R。相对于arm64版本的R,Intel版本的R虽然需要rosetta转译,存在性能损耗,但同时支持CRAN和Bioconductor里的预编译R包,在安装R包上会省事不少。第二步: 安装Rstudio。下载地址为 https://www.rstu

2022-02-04 11:04:07 3955 3

原创 「conda」安装软件时遇到failed with repodata from current_repodata.json 如何处理

利用conda安装软件时,遇到如下提示Collecting package metadata (current_repodata.json): doneSolving environment: failed with repodata from current_repodata.json, will retry with next repodata source.Collecting package metadata (repodata.json):原以为过一会就没问题了,然而一宿过去了,还是这个

2021-12-16 13:08:48 7329 4

原创 如何绘制物理图谱和遗传图谱的对应关系

唐海宝老师开发的JCVI有一个工具,叫做ALLMAPS, 能够展示遗传图谱和物理图谱的对应关系,如下所示但是这个图的目标是为了对ALLMAPS的scaffold结果进行可视化,并不是专门用于展示遗传图谱的标记和物理图谱的对应关系。尽管在allmaps这个组件下提供了plot函数,命令行输入只要求 input.bed 和 seqid, 但实际运行的时候还要求 allmaps path的中间文件, xxxx.lifted.bed, xxxx.agp, weight.txt等文件。为了解决这一问题,我阅读了

2021-12-13 15:33:26 3986 2

原创 创建CDF包 hursta2a520709cdf

调用函数时,遇到hursta2a520709cdf not available 也就是找不到的情况目前网络上找到资料都不够全面,详尽,正确的处理方法如下第一步,安装R包makecdfenv 并加载BiocManager::install('makecdfenv')library(makecdfenv)第二步, 在https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL15048下载 GPL15048_HuRSTA_2a520709.CDF

2021-10-15 19:16:49 841 2

原创 Rust第二课:为什么我的Rust比Python慢!

在我的Rust第一课, 我写了一个程序对fasta中的ATCG进行计数。后面,我就想到一个非常常见的需求,对文件进行读取,统计行数,类似于 wc -l下面是我写的第一个版本的代码, 我命名为myRead.rsuse std::io::BufReader;use std::fs::File;use std::env;use std::io::BufRead;fn main() -> std::io::Result<()> { let args: Vec<Stri

2021-10-13 09:44:44 1073

原创 我的Rust编程第一课

在2020年5月17日,HengLi在它的一篇博客「Fast high-level programming languages」提到,他一直在寻找一门编程语言,生物学家容易使用而且速度还快。( I have always been searching for a high-level language that is fast and easy to use by biologists. )于是在这篇博客中,他评估了一些高级编程语言的处理速度,包括,C, Python, Javascript, LuaJ.

2021-08-29 13:08:47 2062

mac版本gFortran

gfortran-8.2-Mojave.dmg 下载自: https://mac.r-project.org/tools/index.html

2022-01-31

ALLMAPS-testdata.zip

ALLMAPS的练习数据,https://blog.csdn.net/u012110870/article/details/102804433

2021-08-30

「群体遗传学实战」第二课的代码

「群体遗传学实战」第二课: 画出和文章几乎一样的PCA图,对应https://blog.csdn.net/u012110870/article/details/105553025

2021-08-18

IGV自定义BLAT服务

用于建立BLAT服务,方便IGV调用

2021-08-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除