自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 收藏
  • 关注

原创 群体遗传学绘图:在地图上绘制SNP在千人基因组中的频率分布

本文介绍了如何使用R包在地图上绘制千人基因组中基因组变异的频率以及LD等数据,并将其封装成了SNP、SV、INDEL、串联重复(Tandem repeat)的频率两个基因组变异之间的LD此外该函数存在一个局限,即它只能绘制双等位基因(biallelic)的基因组变异,对于多等位基因位点的绘制则需要修改函数源代码。不过多等位基因的变异分析比较复杂,一般都是拆分成多个双等位基因进行分析,所以该函数适用于大多数情况。){## 参数说明。

2025-01-13 19:33:56 709

原创 ggplot2 绘图:使用瀑布图更加清晰地展示数据的变化情况

本文介绍了如何在R语言中使用ggplot2包来绘制瀑布图,本文仅使用了ggplot2原生函数,无需安装其他ggplot2扩展包,适用性较广。ggplot2 绘图:使用瀑布图更加清晰地展示数据的变化情况geom_rect。

2025-01-13 19:27:58 682

原创 被王者荣耀上了一课:时刻掌握自己的状态,基于当前状态做出最适合自己的决定

那么就会收获满满的满足感,此时自己的心情也会很好,若感觉自己状态仍然良好的话,那么可以继续做一些其他的任务,由于这些任务并不是今天必须要完成的,那么自己做的时候也不会有很大的压力,会更加从容,也会效率更高。需要注意的是,任务的难度不等同于任务的重要程度,但多数情况下课题的关键任务总是会有些难度的,并且由于这个任务很关键,在做任务之前可能有些畏难情绪,因此可以将非常重要的任务放在自己状态最好的时候去完成,这样可以做的更好,自己也会收获满满的成就感。而当自身能力不足时,也无法做那些超出自己能力范围的事情;

2025-01-13 19:25:12 261

原创 使用 R 语言读取和写入 HDF5 文件

在R语言中使用rhdf5包写入HDF5# 创建一个dataset,level = 6)# 将dat矩阵写入到h5文件的dataset中# 关闭h5文件H5close()在R语言中使用rhdf5包读取HDF5# 读取h5文件h5fdat <- h5f$matrix_data # 通过 $ 符号来读取h5文件中的数据,$ 后面是dataset的nameH5Fclose(h5f) # 最后关闭文件该文件句柄,其中h5f是前面通过H5Fopen函数得到的对象。

2024-12-13 19:31:20 599

原创 编程小技巧:在Shell、Python和R语言中批量检查文件是否存在,避免潜在错误

本文介绍了在三种编程语言中检查文件或目录是否存在的便捷方式,且均封装成了函数,拷贝以后可以直接使用。本文同步发表于编程小技巧:在Shell、Python和R语言中批量检查文件是否存在,避免潜在错误。

2024-11-27 21:48:20 753

原创 ggplot2画图:如何将散点图的坐标轴居中?

今天来教大家怎么在用ggplot2画散点图的时候将坐标轴居中,即将两个坐标轴交叉位置设置为原点(0,0)。

2024-11-23 11:39:30 596

原创 最稳定的下载GitHub代码的方式

其中Source code开头的文件是GitHub自动生成的压缩包,通常会缺少一些信息,请不要使用Source code开头的文件,而前面两个是作者提供的完整版的压缩包,可以放心下载。GitHub是世界上最大的存储开源软件代码的平台之一,几乎每一个学过编程的人都听过或用过GitHub,其中最常见的操作就是将GitHub的代码下载到本地,然后编译安装。方式的下载仓库,这种方式会将仓库的所有数据下载到本地,包括所有文件和目录的历史版本,即克隆一个一模一样的仓库。

2024-11-23 11:36:49 1933

原创 跟着Nature Genetics学习如何回复审稿人(1)

多用insightful(深刻的),constructive(有建设性的),valuable(宝贵的),keen(敏锐的),meticulous(细致的),critical(深刻的),thoughtful(深思熟虑的,周到的)等词语来形容审稿人的意见。一定要本文首发于跟着Nature Genetics学习如何回复审稿人(1),如果觉得对你有帮助,欢迎关注!

2024-11-19 14:18:47 669

原创 书籍《Interpretable Machine Learning》的学习笔记

本书链接:https://christophm.github.io/interpretable-ml-book/以下目录为书中的目录。

2024-11-15 10:19:05 283 1

原创 《认知觉醒》读书笔记:焦虑与不同层次的成长权重

不同层次的成长权重

2024-11-15 10:17:41 490

原创 awk那些事儿:在awk中使用shell变量的两种方式

awk与shell的交互

2024-11-13 11:09:03 565

原创 shell编程小技巧:set一下,防止程序无脑运行

set -e命令:当脚本中某条命令报错以后立刻退出shell,不再执行后续代码;set -u命令:当使用到未定义的变量以后打印报错信息,然后退出程序。建议大家在所有的shell脚本开头都添加set -ue命令,来确保程序的正确运行。

2024-11-13 11:05:42 722

原创 周末适合做一些总结性的工作,不适合开启新的探索性的任务

如果周末做探索性任务,那么可能只能做很少的工作,根本无法完成整个任务,就必须要将这个任务拖到下周再做,相当于变相的延长了这个任务的时间线(从一周变成了两周),这会让我感觉没有成就感,因此我认为周末适合对本周的工作进行总结,并对目前的任务进行规划和安排,然后从中选择一些任务放到下周的工作安排中,在下周开始的时候就可以干劲满满地开始新的工作了。为了避免这种情况,我认为可以将最困难、最核心的任务作为在早上的第一个工作,因为一般来说早上的精力是最充足的,这个时候是最适合进行深度思考的。

2024-11-09 18:38:06 369

原创 shell编程小技巧4:如何在shell脚本中输出带有时间的日志信息?

我是水木,一个生信在读博士生,这是生信编程技巧系列的第4篇,在这个系列里面我会用简洁易懂的语言分享一些我自己经常用到的能够提高分析效率的编程技巧,希望也能提升你的分析效率!本系列的前几篇文章如下:一般情况下写shell脚本的时候会调用很多的程序,每个程序可能会运行很久,因此在shell脚本中及时输出一些信息就很重要了,这些信息一般会被称为日志(log),它可以帮助用户掌握目前程序的进度,也可以使得用户在程序报错后快速定位到报错代码。在shell中可以在进行某个步骤之前使用命令打印出来接下来要做什么分析,例如

2024-11-09 15:40:05 802

原创 博士生健身总结:10.1-10.31

总的来说,10月份的锻炼次数还是比较少,并且也没有系统的计划,因此11月份的目标是增加锻炼次数,并且针对不同的部位制定一个锻炼计划,例如三分化等。

2024-11-06 10:40:49 746

原创 shell编程小技巧3:使用一行代码对多个变量赋值

本文介绍了两种方式来使用一行shell方式1:采用进程替换和read命令,方式2:采用和read命令,本文参考链接:https://www.baeldung.com/linux/bash-multiple-variable-assignment。

2024-11-02 13:10:29 965

原创 分享一些可以提升生信分析效率的vscode插件

让你的vscode更加好用的插件!

2024-10-30 13:37:10 815

原创 读《认知觉醒》:浅谈费曼技巧

本文同步发表于微信公众号:水木的生信与编程世界,如果觉得本文对您有帮助欢迎关注公众号,我会持续分享更多关于生信的分析经验和实用技巧。

2024-10-26 20:18:08 501

原创 shell编程小技巧2:将多行命令输出到一个文件中

这里的括号表示shell的命令组,shell在遇到括号时会新创建一个子shell来执行其中的命令,当执行结束后子shell将被销毁,而其中定义的变量也将会消失,因此最好不要在子shell定义变量。这样的写法存在一个潜在的问题,即不够美观,并且当运行的命令较多时容易产生混乱,若第一行后面的命令不小心用了。当将多个命令的结果输出到同一个文件中的时候,第一个命令会使用。符号,那么会使得之前命令的输出全部丢失!会覆盖掉文件原有的内容,从而创建一个新的文件,而。符号,而后面的命令必须使用。

2024-10-26 10:13:20 508

原创 shell编程小技巧:进程替换

shell编程利器:进程替换

2024-10-21 09:00:00 342

原创 博士生锻炼总结:2024.9.9-9.30

博士生健身总结

2024-10-19 11:26:16 593

原创 生信经验分享:高效率并行执行任务

在使用paralleltask进行并行执行任务时,需要控制总的任务数目不要太大(增加参数lines的大小),否则会有很大的开销都用来新建目录和分配任务,从而造成不必要的浪费。本文同步发表于微信公众号:水木的生信与编程世界,如果觉得本文对您有帮助欢迎关注公众号,我会持续分享更多关于生信的分析经验和实用技巧。

2024-10-15 09:00:00 1686

原创 关于博士生科研思维的一些想法

博士生的碎碎念

2024-09-12 23:42:13 243

原创 博士生锻炼记录:2024.9.8

博士生锻炼记录

2024-09-08 21:55:15 490

原创 在vscode中开发R包并给函数添加帮助文档

你想拥有自己的R包吗?

2024-09-01 20:47:53 1109

原创 让我看看谁还在用conda?

mamba:conda的完美替代

2024-04-11 10:50:15 1253

原创 如何优雅设置DeepVariant和PEPPER使用的线程数?

通过环境变量方式限制DeepVariant和PEPPER所用线程数

2023-07-16 00:03:01 693 3

原创 Windows:设置右键用RStudio打开文件和文件夹

通过修改注册表编辑器实现右键使用RStudio打开文件夹和脚本

2023-05-24 21:32:29 3361

原创 Winnowmap多线程之坑

Winnowmap多线程之坑

2023-02-26 22:04:34 579

原创 parallel的一个小坑

并行有风险,用parallel需谨慎

2022-10-30 22:12:54 1091

原创 两个shell实用函数:icd和mgrep

shell实用函数

2022-07-20 21:02:29 545

原创 Windows11不显示WiFi图标

目录问题描述解决方案1. 网上的方法(并不可行)2. 询问联想客服打开网络适配器的方法1. 方法1-通过我的电脑2. 方法2-Win+X命令问题描述电脑启动以后突然遇到下面的情况,WiFi图标不见了,也连不上网,经过搜索,发现是驱动程序的问题,找到网络适配器发现wifi那里出现了感叹号,如下图:可以看到MediaTek Wi-Fi 6 MT7921 Wireless LAN Card这个驱动出现了感叹号,说明它出了问题。解决方案1. 网上的方法(并不可行)参考:适配器遇到与驱动程序或硬件

2022-02-27 13:11:18 19253 22

原创 R语言-制作motif的PWM

目录一、PWM与PFM的介绍二、根据碱基序列手工制作PFM与PPM1. 主要实现函数2. 实现效果2.1 制作DNA的motif logo2.2 制作RNA的motif logo三、PFM-\>PPM-\>PWM四、待优化一、PWM与PFM的介绍motif指的是转录因子偏好结合的DNA序列模式或RNA结合蛋白偏好结合的序列模式,一般使用PWM来表示motif。制作PWM的过程如下:首先计算所有序列每个位置的碱基频数,可以得到PFM(Position FrequencyMatrix),

2022-02-17 09:29:53 3761

原创 ggplot2-绘图-箱线图

目录前面的啰嗦绘图数据说明基本箱线图分组箱线图美化分组箱线图箱线图完整版代码基本箱线图的完整代码分组箱线图的完整代码前面的啰嗦本教程对绘图所需数据和绘图过程进行了一步步的解释,稍显啰嗦,没时间细看或不想一步步看的朋友可以直接点击目录最后一节:箱线图完整版代码绘图数据说明用到的数据是mpg数据集,这是ggplot2包自带的数据集,可以使用以下代码查看该数据集的基本情况:library(ggplot2)?mpg # 或者help(mpg)从帮助文档中可以看出这是一个234x11的数据框,它记录

2022-01-28 22:44:59 13262

原创 从Docker镜像创建Singularity镜像(SIF文件)

Singularity可以方便地处理Docker镜像,以下是三种方式:方式1:从docker uri开始参考:https://sylabs.io/guides/3.7/user-guide/singularity_and_docker.html#remotely-hosted-images有以下两个命令可用:singularity pull docker://godlovedc/lolcow # 下载pre-built imagesingularity build mylolcow_latest.

2021-08-15 16:56:05 4926

原创 Windows路径转成Linux子系统的路径

需求说明自己用的是windows电脑,也开启了windows下面的linux子系统,有时候需要在linux子系统里面操作一些文件,而这些文件的路径是windows形式,windows路径是使用的反斜杠符号\,而linux则使用的是斜杠/,在路径特别长的时候一个个的去修改这两个符号会很麻烦;另一方面,在linux子系统里面,windows下面的CDE盘是挂载在/mnt盘下面的,如下图所示:这里的cde分别对应于windows里的CDE盘,举个例子,在windows里面的目录是C:\Users\asus

2021-07-16 09:56:36 5821

原创 每周学习ggplot2(一):绘制柱状图与散点图

目录前言习题Problem 2习题描述习题里的图我画的图我的绘图代码前言偶然看到了这个链接里有几张图可以用来练习ggplot2,就试着写了一下代码,这里记录一些我认为有些难度的图与代码。习题Problem 2习题描述Using the mpg dataset in the ggplot2 package, replicate the plot below using the following settings:Set alpha = 0.5 for the width of barsUse

2021-05-02 19:18:52 5812 2

原创 PFM,PPM,PWM解释

PFM全称是Position Frequency Matrix,用以代表motif的碱基分布频数,即某个位置四种碱基出现的次数,例子: A C G T0 8 52 23 151 7 7 2 832 16 21 0 613 73 9 8 84 17 36 28 175 49 7 18 24PPM全称是Position Probability Matrix,是在PFM基础上计算了每个位置四种碱基的出现频率

2021-04-28 11:30:37 2447

原创 matplotlib.pyplot绘图笔记

绘图基础建议使用ax来绘图,生成一张图的示例代码:# 方式1:f, ax = plt.subplots()# 方式2:f = plt.figure()ax = f.add_subplot()生成两幅子图的示例代码,排列方式为一行两列:# 方式1fig, axes=plt.subplots(nrows=1, ncols=2) # 有两幅子图,排列方式为一行两列axes是一个ndarrayax1, ax2 = axes# 方式2fig = plt.figure()ax1 = f

2021-04-25 19:14:40 3283

原创 Codewars笔记

这里写自定义目录标题寻找分解质因数(5kyu)问题描述:我的解决代码寻找分解质因数(5kyu)问题描述:Given a positive number n > 1 find the prime factor decomposition of n. The result will be a string with the following form ;“(p1**n1)(p2**n2)…(pk**nk)”Example: n = 86240 should return “(2**5)(5)(

2021-04-25 16:00:52 208

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除