徐洲更hoptop
码龄9年
  • 860,860
    被访问
  • 681
    原创
  • 4,591
    排名
  • 1,301
    粉丝
关注
提问 私信
  • 毕业院校: 中国科学院大学
  • 加入CSDN时间: 2013-09-13
博客简介:

xuzhougeng blog

博客描述:
徐洲更的第二大脑
查看详细资料
  • 4
    领奖
    总分 888 当月 45
个人成就
  • 获得569次点赞
  • 内容获得188次评论
  • 获得2,495次收藏
创作历程
  • 7篇
    2022年
  • 25篇
    2021年
  • 144篇
    2020年
  • 214篇
    2019年
  • 181篇
    2018年
  • 81篇
    2017年
  • 29篇
    2016年
成就勋章
TA的专栏
  • R
    5篇
  • MacOS
    1篇
  • Rdebug
    3篇
  • 随笔
    2篇
  • Linux
    3篇
  • Rust
    1篇
  • 编程学习
    1篇
  • Python
    1篇
  • C++
    3篇
  • 生物信息学
    45篇
  • 基因组
    18篇
  • 数据挖掘
    2篇
  • 转录组
    1篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

使用非负最小二乘回(NNLS)归进行细胞类型转移

2019年发表在Nature上的文章【The single-cell transcriptional landscape of mammalian organogenesis】在方法部分提到,使用NNLS(non-negative linear-square)回归的方法分析两个细胞图谱数据集中相关细胞类型。这个方法,在我搜索的中文教程中都没有出现过,所以这里以两个pbmc的数据集为例进行介绍,如何复现文章的方法。10x的细胞数据集的预处理部分不做过多介绍, 如下代码以10x官网提供的数据为例libra
原创
发布博客 2022.03.29 ·
190 阅读 ·
2 点赞 ·
0 评论

macOS的configd占了我好多内存

在我没有启动多少应用的时候,macOS已经显示它使用了22.09GB内存。其中App内存是15.81GB, 我并没有打开那么多App.这估计跟configd有关,因为configd占用了20.55G内存。那么configd是真的占用了内存,还是就是声明自己会用到那么多内存呢?我尝试着调用了比较多的内存,直接用了29.3Gb内存cols <- 8189rows <- 320127mat1 <- matrix(data = 0, nrow=320127, ncol = 8189)
原创
发布博客 2022.02.27 ·
365 阅读 ·
0 点赞 ·
0 评论

MacOS的ARM64的R如何解决编译问题

处理gsl-config not found, lzma.h not found 的系列报错问题
原创
发布博客 2022.02.21 ·
187 阅读 ·
0 点赞 ·
0 评论

我的生信自学心得分享

我的生信心得分享
原创
发布博客 2022.02.16 ·
642 阅读 ·
9 点赞 ·
0 评论

对水稻的注释进行了二次整理

代码和数据都在GitHub上,见 https://github.com/xuzhougeng/rice_annotaiton
原创
发布博客 2022.02.15 ·
292 阅读 ·
0 点赞 ·
0 评论

SSH如何免密登录服务器

最近切换到了MacOS平台进行办公,就不能用Windows下好用的XShell,用上了传统在命令行输入 ssh -p port user@address的方式进行登录了。作为一个‘懒惰’的人,我肯定是要避免重复的运行登录命令了。回溯用过的命令进行复用是一种方式,但还是需要输入密码,所以我的操作方式如下第一步: 通过编辑 ~/.ssh/config文件, 为指定服务器增加别名Host 别名 HostName 服务器地址 User 用户名 Port 端口这样子就能用 ssh 目
原创
发布博客 2022.02.10 ·
545 阅读 ·
0 点赞 ·
0 评论

ARM架构的MacOS如何配置R语言分析环境

去年11月换了一台16寸Macbook Pro,用上了苹果自己开发的arm架构的M1芯片。换上新电脑后,一个重要的事情,就是配置好我的R语言分析环境,同时做一期视频教程了。本篇内容是视频教程的概要,详细版见视频。第一步,安装R语言,目前推荐Intel版本的R。相对于arm64版本的R,Intel版本的R虽然需要rosetta转译,存在性能损耗,但同时支持CRAN和Bioconductor里的预编译R包,在安装R包上会省事不少。第二步: 安装Rstudio。下载地址为 https://www.rstu
原创
发布博客 2022.02.04 ·
1329 阅读 ·
0 点赞 ·
0 评论

mac版本gFortran

发布资源 2022.01.31 ·
dmg

「conda」安装软件时遇到failed with repodata from current_repodata.json 如何处理

利用conda安装软件时,遇到如下提示Collecting package metadata (current_repodata.json): doneSolving environment: failed with repodata from current_repodata.json, will retry with next repodata source.Collecting package metadata (repodata.json):原以为过一会就没问题了,然而一宿过去了,还是这个
原创
发布博客 2021.12.16 ·
1343 阅读 ·
0 点赞 ·
1 评论

如何绘制物理图谱和遗传图谱的对应关系

唐海宝老师开发的JCVI有一个工具,叫做ALLMAPS, 能够展示遗传图谱和物理图谱的对应关系,如下所示但是这个图的目标是为了对ALLMAPS的scaffold结果进行可视化,并不是专门用于展示遗传图谱的标记和物理图谱的对应关系。尽管在allmaps这个组件下提供了plot函数,命令行输入只要求 input.bed 和 seqid, 但实际运行的时候还要求 allmaps path的中间文件, xxxx.lifted.bed, xxxx.agp, weight.txt等文件。为了解决这一问题,我阅读了
原创
发布博客 2021.12.13 ·
1341 阅读 ·
3 点赞 ·
0 评论

创建CDF包 hursta2a520709cdf

调用函数时,遇到hursta2a520709cdf not available 也就是找不到的情况目前网络上找到资料都不够全面,详尽,正确的处理方法如下第一步,安装R包makecdfenv 并加载BiocManager::install('makecdfenv')library(makecdfenv)第二步, 在https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL15048下载 GPL15048_HuRSTA_2a520709.CDF
原创
发布博客 2021.10.15 ·
135 阅读 ·
0 点赞 ·
0 评论

Rust第二课:为什么我的Rust比Python慢!

在我的Rust第一课, 我写了一个程序对fasta中的ATCG进行计数。后面,我就想到一个非常常见的需求,对文件进行读取,统计行数,类似于 wc -l下面是我写的第一个版本的代码, 我命名为myRead.rsuse std::io::BufReader;use std::fs::File;use std::env;use std::io::BufRead;fn main() -> std::io::Result<()> { let args: Vec<Stri
原创
发布博客 2021.10.13 ·
92 阅读 ·
0 点赞 ·
0 评论

ALLMAPS-testdata.zip

发布资源 2021.08.30 ·
zip

我的Rust编程第一课

在2020年5月17日,HengLi在它的一篇博客「Fast high-level programming languages」提到,他一直在寻找一门编程语言,生物学家容易使用而且速度还快。( I have always been searching for a high-level language that is fast and easy to use by biologists. )于是在这篇博客中,他评估了一些高级编程语言的处理速度,包括,C, Python, Javascript, LuaJ.
原创
发布博客 2021.08.29 ·
1096 阅读 ·
0 点赞 ·
0 评论

如何用WGDI进行共线性分析(一点五)

在如何用WGDI进行共线性分析(一), 我们基于blastp的结果绘制了点图,之后用 -icl 模块进行进行共线性分析,得到了 collinearity 结果 。后面就直接基于该文件开始计算ka/ks,然后绘制ks plot.但是,在那篇教程的时候,我其实还有一个问题,就是能不能直接根据 collinearity 结果绘制点图呢?在WGDI提供的流程示意图中,没有这一分支虽然自己写代码实现也不复杂,但是为了避免重复造轮子,我们使用了JCVI的图形模块绘制dotplotjcvi.graphcis.do
原创
发布博客 2021.08.18 ·
391 阅读 ·
0 点赞 ·
0 评论

「群体遗传学实战」第二课的代码

发布资源 2021.08.18 ·
zip

IGV自定义BLAT服务

发布资源 2021.08.18 ·
py

如何在IGV上使用BLAT搜索非模式物种(续)

在如何在IGV上使用BLAT搜索非模式物种中,我们讨论如何用Apache的CGI服务器,来响应IGV发送的BLAT请求。考虑到我们大部分的时候都是个人使用,并不需要Apache这种重量级的Web服务器,因此完全可以省去这一组件。我之前学过Python和Django和Flask这两种网页应用框架,其中Flask比较轻量,非常适合我们这种小型应用。因此,我就用Flask编写了一个Blat网页应用,用来响应IGV的请求。首先,安装Flask(为了避免冲突,我用了虚拟环境)mkdir myprojectcd
原创
发布博客 2021.08.18 ·
77 阅读 ·
0 点赞 ·
0 评论

如何在IGV上使用BLAT搜索非模式物种

IGV提供了BLAT,用于进行序列搜索,但可惜我一直用不上,因为它默认是调用了UCSC的CGI工具,将我们的输入序列发送到https://genome.ucsc.edu/cgi-bin/hgBlat处理,处理后返回JSON文件用于展示。因此,除非我们自己搭建一个UCSC类似的网站,否则,无法用到IGV的这个功能。我觉得肯定不只是我一个人有这个问题,所以我就去谷歌上用关键词 “custom genome BLAT IGV” 进行检索, 果然发现有很多人都有类似的需求,我找到最早一条是2016年,但是距今.
原创
发布博客 2021.08.17 ·
87 阅读 ·
0 点赞 ·
0 评论

hifiasm对HiFi PacBio进行组装

hifiasm是一个能有效利用PacBio HiFi测序技术,在分型组装图(pahsed assembly gprah)中可靠的表示单倍体信息的算法。流程介绍hifiasm的分析流程如下,主要分为3个阶段第一阶段:通过所有序列的相互比对,对前在测序错误进行纠正。如果一个位置只存在两种碱基类型,且每个碱基类型至少有3条read支持,那么这个位置会被当作杂合位点,否则,视作测序错误,将被纠正。第二阶段:根据序列之间的重叠关系,构建分型的字符串图(phased string graph)。其中调整朝向的序
原创
发布博客 2021.07.28 ·
1781 阅读 ·
5 点赞 ·
3 评论
加载更多