R
生信补给站
分享R python语言用于数据统计,挖掘,可视化展示以及生物信息等场景的内容
展开
-
tidyverse|数据分析常规操作-分组汇总(sumamrise+group_by)
| 本文首发于 “生信补给站” https://mp.weixin.qq.com/s/tQt0ezYJj3H7x3aWZmKVEQ使用tidyverse进行简单的数据处理:盘一盘Tidyverse| 筛行选列之select,玩转列操作盘一盘Tidyverse| 只要你要只要我有-filter 筛选行Tidyverse|数据列的分分合合,一分多,多合一Tidyverse| XX_join :多个数据表(文件)之间的各种连接本次介绍变量汇总以及分组汇总。一 summarise 汇总汇总函数 su原创 2020-07-06 22:59:10 · 2392 阅读 · 0 评论 -
Tidyverse| XX_join :多个数据表(文件)之间的各种连接
本文首发于公众号:“生信补给站” Tidyverse| XX_join :多个数据表(文件)之间的各种连接前面分享了单个文件中的select列,filter行,列拆分等,实际中经常是多个数据表,综合使用才能回答你所感兴趣的问题。本次简单的介绍多个表(文件)连接的方法。一 载入数据,R包library(tidyverse)x <- tribble( ~key, ~val_x, 1, "x1", 2, "x2", 3, "x3")y <- tribbl原创 2020-06-04 21:49:05 · 1061 阅读 · 0 评论 -
LDheatmap | SNP连锁不平衡图(LD)可视化,自己数据实现版!
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/Gl6BChxSYbSHMo9oMpufPg连锁不平衡图,用来可视化不同SNP之间的连锁程度,前同事间俗称“倒三角”图。本文使用自己的数据,因为安装R包后使用内置数据集运行出结果较容易,但是自己的数据就可能会有一些不大不小的“坑”,我替你们趟了。。。一 载入R包 数据数据为内置CEUData保存后,进行了“细微”的处理(去掉SNP碱基之间的“/”),这种基因型文件很常见;library("LDheatmap")#.原创 2020-05-09 10:36:04 · 7910 阅读 · 1 评论 -
Tidyverse|数据列的分分合合,爱恨情仇
本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要。比如基因列为ID的需要转为常见的symbol,基因列为symbol|ID的就需要拆开了!excel分列可以解决,但是表达量数据较大,且excel容易产生“数据变形”。一, 载入数据,R包使用TCGA下载的数据,使用以下几行几列, 作为示例lib...原创 2020-04-28 23:21:32 · 880 阅读 · 0 评论 -
R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/_rTWJHcbUu2Eqtex74gUBA散点图绘制回归曲线很常用,那么添加上回归方程,P值,R2或者方差结果表等可以展示更量化的信息。那加起来复杂吗?还真不一定!一 载入数据和R包使用内置数据集library(ggplot2) #加载ggplot2包library(dplyr) #加载dplyr包...原创 2020-04-16 21:31:27 · 2533 阅读 · 0 评论 -
R|tableone 快速绘制文章“表一”-基线特征三线表
首发于“生信补给站” :https://mp.weixin.qq.com/s/LJfgxbTqsp8egnQxEI0nJg生物医学或其他研究论文中的“表一”多为基线特征的描述性统计。使用R单独进行统计,汇总,然后结果复制到excel表中,耗时耗力且易错!tableone包“应运而生”,可以非常简单快捷的解决这个问题,重点是学习成本很低,大概几分钟?一 载入数据,R包## install...原创 2020-03-17 12:37:59 · 9121 阅读 · 6 评论 -
盘一盘Tidyverse| 只要你要只要我有-filter 筛选行
首发于“生信补给站” ,https://mp.weixin.qq.com/s/l9Ci7wREQWpEV5dTvKuoHg,更多的R统计,绘图,生信,请移步????上篇根据 msleep数据集,介绍了列的操作,盘一盘Tidyverse| 筛行选列之select,玩转列操作本文盘一盘行的筛选 ????一 载入R包,数据#载入R包#install.packages("tidyverse")libr...原创 2020-03-02 09:55:51 · 1418 阅读 · 0 评论 -
盘一盘Tidyverse| 筛行选列之select,玩转列操作
文章首发于“生信补给站” : https://mp.weixin.qq.com/s/ldO0rm3UM_rqlFnU3euYaA2020年,开封 《R 数据科学》R for data science,系统学习R 数据处理。**在一个典型的数据科学项目中,需要的工具模型大体如下图所示。 ...原创 2020-01-20 10:37:29 · 3214 阅读 · 0 评论 -
gganimate|创建可视化动图,让你的图表会说话
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/kKQ2670FBiDqVCMuLBL9NQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。介绍一个主要用于绘制动画的ggplot2的扩展包—gganimate包。Hans Rosling的关于“New Insights on Poverty”的TED演讲绝对是对我影响最大的几个TED...原创 2019-12-06 10:01:14 · 855 阅读 · 0 评论 -
ggforce|绘制区域轮廓-区域放大-寻找你的“onepiece”
首发于“生信补给站” https://mp.weixin.qq.com/s/fm69bw-3cww1YEW_kBcTHQ更多关于R语言,ggplot2绘图,生信分析的内容,关注有惊喜????。拥有财富、名声、权力,这世界上的一切的男人 “海贼王”哥尔·D·罗杰,在被行刑受死之前说了一句话,让全世界的人都涌向了大海。“想要我的宝藏吗?如果想要的话,那就到海上去找吧,我全部都放在那里。”,世界开始...原创 2019-11-30 10:21:01 · 543 阅读 · 0 评论 -
精心整理(含图版)|你要的全拿走!(R数据分析,可视化,生信实战)
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/ZEjaxDifNATeV8fO4krOIQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。为了能更方便的查看,检索,对文章进行了精心的整理。建议收藏,各取所需,当前没用也许以后就用到了呢!一 R资料+计划R语言精品资料年中无套路赠送 R-plotly|交互式甘特图(Gantt c...原创 2019-11-12 09:53:05 · 1775 阅读 · 0 评论 -
R-机器学习| KNN算法
本文使用威斯康星州临床科学中心的关于乳腺癌肿瘤的数据集。一 读入数据cancer <- read.csv('breast_cancer.csv',stringsAsFactors = F)用str(cancer)观察一下数据第一例是id,第二列为diagnosis诊断类型(良性/恶性),第3-32个特征其实只包含了十个属性,但是以mean均值,standard error标准差,“...原创 2019-11-10 22:29:37 · 631 阅读 · 0 评论 -
R-plotly|交互式甘特图(Gantt chart)-项目管理/学习计划
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/CGz51qOjFSJ4Wx_qOMzjiw更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。甘特图(Gantt chart),又常被称为横道图或者条状图,是现代企业项目管理领域运用最为广泛的一种图示。就是通过条形来显示项目的进度、时间安排等相关情况的。项目管理外,也可以用来管理学习...原创 2019-10-21 22:02:27 · 864 阅读 · 0 评论 -
ggplot2|详解八大基本绘图要素,你需要的都在这-目录版
本文首发于微信公众号 “ 生信补给站 ” ,期待您的关注!!!https://mp.weixin.qq.com/s/UMuZ1MiuKDheHk9mwA9EXA“一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aesthetic attributes, 缩写为aes, 包括颜色、形状、大小等)的一个映射。此外, 图形中还...原创 2019-09-27 18:32:40 · 827 阅读 · 0 评论 -
maftools|TCGA肿瘤突变数据的汇总,分析和可视化
本文首发于公众号“生信补给站”,https://mp.weixin.qq.com/s/WG4JHs9RSm5IEJiiGEzDkg之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现...原创 2019-09-16 23:22:10 · 11701 阅读 · 12 评论 -
maftools | 从头开始绘制发表级oncoplot(瀑布图)
本文首发于微信公众号 “ 生信补给站 ” ,期待您的关注!!!原文链接:https://mp.weixin.qq.com/s/G-0PtaoO6bYuhx_D_Rlrlw对于组学数据的分析和展示来说,maftools算是一个宝藏“R包”,可用于MAF格式的组学数据的汇总,分析和可视化展示。 随着癌症基因组学的进步, 突变注释格式 (MAF) 被广泛用于存储检测到的somatic va...原创 2019-09-03 10:38:24 · 4235 阅读 · 0 评论 -
ggplot2 |legend参数设置,图形精雕细琢
本文首发于微信公众号“生信补给站”,https://mp.weixin.qq.com/s/A5nqo6qnlt_5kF3_GIrjIA学习了ggplot2|详解八大基本绘图要素后,就可以根据自己的需要绘制图形。前面也给出了一些ggplot2绘制生信分析基本图形的例子pheatmap|暴雨暂歇,“热图”来袭!!!ggplot2-plotly|让你的火山图“活”过来ggplot2|扩展包从0开...原创 2019-08-20 11:37:59 · 6720 阅读 · 0 评论