GUI Research Group
机器学习, 生物信息
展开
-
R语言观察日志(part26)--去除重复行
去除重复行原创 2022-07-07 23:13:16 · 1004 阅读 · 0 评论 -
R语言观察日志(part25)--将某列设置为行名
将某列设置为行名原创 2022-07-07 11:14:16 · 3088 阅读 · 1 评论 -
R语言观察日志(part24)--初始化设置
学习笔记,仅供参考,有错必纠按需更新原创 2022-06-27 18:11:17 · 380 阅读 · 0 评论 -
生信可视化(part4)--相关性图
相关性图原创 2022-06-20 19:31:36 · 996 阅读 · 1 评论 -
生信可视化(part3)--小提琴图
学习笔记,仅供参考,有错必纠原创 2022-06-19 10:49:34 · 548 阅读 · 0 评论 -
生信可视化(part2)--箱线图
学习笔记,仅供参考,有错必纠排序箱线图主要用于展示在各个组织或器官中,某个基因的表达量.输入数据格式:代码:x轴表示肿瘤类型,y轴表示基因AP1的表达量,不同的肿瘤用不同颜色表示,由此图可以看出基因AP1在哪些组织中是高表达的.差异箱线图用于比较两组之间某基因表达的差异.输入数据格式:代码:x轴表示正常组和肿瘤组,y轴表示SEMA3D的基因表达量. 图上方为两组之间差异的P值,当P小于给定显著性水平α\alphaα时,则表示两组之间差异显著.输入数据格式:代码:x轴表示基因名称,y轴表示基因原创 2022-06-18 09:46:10 · 1426 阅读 · 0 评论 -
R语言观察日志(part24)--writexl包
writexl包功能比较简单,仅有输出 Excel 功能。快速、不依赖 java 和 Excle 是它绝对的优势,并且输出文件相比openxlsx包较小。转载 2022-06-16 08:25:05 · 2806 阅读 · 0 评论 -
生信可视化(part1)--柱状图
学习笔记,仅供参考,有错必纠y轴代表gene的名称,x轴代表gene出现的数目, 通过此图可以看出哪些gene出现次数最多,从而找出核心gene.显著性柱状图,在原本柱状图的基础上增加了柱子颜色(统计学上的显著性),该图一般用于GO结果展示.显著性柱状图的y轴代表GO的名称,x轴代表富集在GO上gene的数目,柱子颜色越红代表gene在GO上富集越显著.x轴代表样品名,y轴代表免疫细胞的含量(百分比).分类柱状图可用于展示GO富集结果. y轴表示GO名称,x轴代表富集在GO上gene的数目,柱子不同原创 2022-06-14 18:54:27 · 524 阅读 · 1 评论 -
利用Seurat包入门生物信息学(part2)--引导案例之PBMC聚类
学习笔记,仅供参考,有错必纠参考资料:https://satijalab.org/seurat/index.html;备注:这是我第一次学习的笔记,对此了解更深入之后,会重新整理文章目录Seurat Package加载包读取数据数据预处理质量控制,选择需要分析的细胞可视化标准化数据鉴定高度变化的基因Scaling the data线性降维决定数据集维度JackStrawPlotElbowPlotSeurat Package在本教程中,我们将分析10X Genomics公司免费提供的外周血单核细原创 2022-05-07 15:47:17 · 644 阅读 · 0 评论 -
R语言观察日志(part23)--bibliometrix包
R语言文献计量分析笔记参考文献:如何用 R 快速了解科研领域?; BiblioShiny使用介绍; R语言快速实现文献计量分析GitHub:https://github.com/massimoaria/bibliometrixbiblioshiny教程:http://bibliometrix.org/biblioshiny/assets/player/KeynoteDHTMLPlayer.html文章目录bibliometrix描述安装数据开始分析How to use ?作者研究文献研究主题研究未原创 2021-04-25 19:41:10 · 5580 阅读 · 17 评论 -
今日代码(20210313)--美赛代码记录
代码记录第1及第6题(PageRank+Lasso)my_pagerank <- function(M, r, n, b) { N <- dim(M)[2] r <- r/sum(abs(r)) temp_matrix = matrix(1/N, nrow = N, ncol = N) M_hat <- b*M + (1-b)*temp_matrix for (i in c(1:n)) { r <- M_hat%*%r } retu原创 2021-03-13 10:44:06 · 259 阅读 · 0 评论 -
今日代码(20210225)--数据处理
代码记录数据预处理+主成分+熵值法®library(VIM)library(mice)library(readr)library(psych)library(fpc)library(lattice)library(MASS)#### 定义函数 #####统计行/列 缺失值函数countNaN <- function(myline) { return(sum(is.na(myline)))}#定位函数#dataF只能传递矩阵或者数据框myPosition &l原创 2021-02-25 17:11:10 · 229 阅读 · 0 评论 -
R语言观察日志(part22)--glmnet包
学习笔记,仅供参考,有错必究文章目录glmnet包描述用法参数细节值示例代码glmnet包使GLM具有Lasso或Elasticnet正则化.描述用惩罚极大似然拟合广义线性模型。在正则化参数lambda的数值网格上计算Lasso或elastic-net惩罚的正则化路径。可以处理各种形状的数据,包括非常大的稀疏数据矩阵。拟合范围包括以下模型:线性logistic多项式泊松Cox回归。用法glmnet( x, y, family = c("gaussian"原创 2021-01-13 10:14:53 · 1516 阅读 · 0 评论 -
R语言观察日志(part21)--包的组件之元数据
学习笔记,仅供参考,有错必纠文章目录包的元数据依赖:包需要什么版本其他依赖包的元数据依赖:包需要什么Imports和Suggests的不同在于依赖程度。Imports(输入)Suggests(建议)版本其他依赖Depends(依赖)LinkingTo(链接到)Enhances(增强)...原创 2020-12-25 07:56:28 · 234 阅读 · 0 评论 -
R语言观察日志(part20)--包的组件之R代码
学习笔记,仅供参考,有错必纠文章目录R代码R代码的工作流程组织函数代码风格对象名称空格余下的请看R语言观察日志(part16)--Google‘s R Style Guide顶层代码加载代码R运行环境何时需要副作用S4类、泛型和方法CRAN注记R代码R代码的工作流程组织函数代码风格formatR包lintr包对象名称空格余下的请看R语言观察日志(part16)–Google‘s R Style Guide顶层代码加载代码原创 2020-12-24 21:09:49 · 408 阅读 · 1 评论 -
R语言观察日志(part18)--.C和.Call
学习笔记,仅供参考,有错必纠文章目录.C(外来函数接口)描述用法参数细节返回值参数类型注意.Call(C/C++代码的接口)描述用法参数细节返回值.C(外来函数接口)描述函数调用已经加载到R中的编译代码。用法.C(.NAME, ..., NAOK = FALSE, DUP = TRUE, PACKAGE, ENCODING).Fortran(.NAME, ..., NAOK = FALSE, DUP = TRUE, PACKAGE, ENCODING)参数参数解原创 2020-12-22 20:49:57 · 641 阅读 · 1 评论 -
R语言观察日志(part17)--.Primitive
学习笔记,仅供参考,有错必纠文章目录.Primitive描述用法参数细节例子.Internal描述用法参数.Primitive描述.Primitive通过名字查找一个内部实现的函数。用法.Primitive(name)参数参数解释nameR函数的名称细节与.Internal函数相比,.Primitive函数的优点是参数传递的潜在效率,要了解更多细节,请参阅"R内部结构手册"。所有基本函数都在基命名空间中。这个函数几乎从未使用过,name或原创 2020-12-22 19:52:19 · 576 阅读 · 0 评论 -
R语言观察日志(part16)--Google‘s R Style Guide
学习笔记,仅供参考自翻,有错必究文章目录Google's R Style GuidesummaryR语言风格R语言规则符号和命名文件名标识符每行长度(注意)缩进空格花括号被大括号括起来赋值分号总体布局和排序注释函数定义和调用功能文档例子函数TODO Style(to do 要做, 但是没有完成的事)附加功能对象和方法特别的临别赠言参考文献Google’s R Style GuideR是一种高级编程语言,主要用于统计计算和图形,R编程风格指南的目标是使我们的R代码更容易阅读、共享和验证,以下规则原创 2020-12-19 19:46:50 · 367 阅读 · 2 评论 -
R语言观察日志(part15)--R的缺点
学习笔记,仅供参考,有错必纠摘自:基于R语言的机器学习R的缺点原创 2020-11-06 21:56:10 · 177 阅读 · 0 评论 -
今日代码(200924)--缺失值处理
缺失值处理对110个城市10年的数据进行缺失值处理。knitr::opts_chunk$set(echo = T, message = FALSE, warning = FALSE)导包library(VIM)library(mice)library(readr)library(psych)library(fpc)library(lattice)library(MASS)自定义函数#统计行/列 缺失值函数countNaN <- function(myline) {原创 2020-09-24 22:43:08 · 426 阅读 · 0 评论 -
R与量化(part1)--量化概述
学习笔记,经供参考,有错必纠参考自:《R的极客理想》–张丹文章目录R与量化量化概述学习框架R语言量化相关工具包量化程序操作步骤量化交易平台系统架构技术架构FinTechR与量化量化概述学习框架R语言量化相关工具包数据管理(数据集抓取、存储、读取、时间序列、数据处理)zoo(时间序列对象)、xts(时间序列处理)、timeSeries(Rmetrics系时间序列对象)、timeDate(Rmetrics系时间序列处理)、data.table(数据处理)、quantmod原创 2020-08-14 20:46:26 · 490 阅读 · 0 评论 -
R开发(part12)--基于RC的面向对象编程
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发基于RC的面向对象编程创建RC类和对象对象赋值定义对象的方法RC对象内置方法和内置属性RC类的辅助函数R开发基于RC的面向对象编程RC是Reference classes的简称,又被称为R5,RC不同于原来的S3和S4对象系统,RC对象系统的方法是在类中自定的,而不是泛型函数。RC对象的行为更类似于其他的编程语言,实例化对象的语法也有所改变。但由于RC对象系统还是依赖于S4对象系统,我们可以简单地理解为RC是对S原创 2020-08-12 00:12:39 · 437 阅读 · 4 评论 -
R开发(part11)--基于S4的面向对象编程
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发基于S4的面向对象编程创建S4对象访问S4对象的属性S4的泛型函数查看S4对象的函数R开发基于S4的面向对象编程S4对象系统是一种R语言面向对象实现方式,S4对象有明确的类定义、参数定义、参数检查、继承关系、实例化、接口函数、实现函数等面向对象系统的特征。创建S4对象setClass函数S4对象系统有专门的类定义函数setClass和类的实例化函数new,我们先看看setClass的语法。set原创 2020-08-11 11:49:00 · 359 阅读 · 0 评论 -
R开发(part10)--基于S3的面向对象编程
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发面向对象面向对象的R语言实现基于S3的面向对象编程泛型函数和方法调用查看S3对象的函数S3对象的继承调用方式S3对象的缺点R开发面向对象R语言中有三种面向对象的编程实现,即S3类型、S4类型和RC类型。S3和S4都是基于泛型函数的,RC则是完全的面向对象实现。面向对象的R语言实现定义老师对象和行为,封装到teacher()泛型函数中;定义同学对象和行为,封装到student()泛型函数中.#定义老师对原创 2020-08-11 09:40:13 · 339 阅读 · 0 评论 -
R开发(part9)--文件系统管理
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发文件系统管理查看目录创建目录检查目录是否存在重命名以及删除目录其他目录操作查看文件创建、重命名及删除文件几个特殊的目录R开发文件系统管理计算机的文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易,文件系统使用文件和树形目录的抽象逻辑概念代替了硬盘和光盘等物理设备使用数据块的概念,用户使用文件系统来保存数据,不必关心数据实际保存在硬盘(或者光盘)的地址为多少的数据块上,只需要记住这个文件的所属目原创 2020-08-10 22:05:05 · 244 阅读 · 0 评论 -
R开发(part8)--应用R语言中的函数环境空间
学习笔记,仅供参考,有错必纠文章目录R开发应用R语言中的函数环境空间R语言的函数环境空间封闭环境绑定环境运行环境调用环境函数环境空间图示R开发应用R语言中的函数环境空间R语言的函数环境空间在R语言中,变量、对象、函数都存在于环境空间中,而函数又可以有自己的环境空间,我们可以在函数内再定义变量、对象和函数,循环往复就形成了我们现在用的R语言环境系统。一般情况下,我们可以通过new.env去创建一个环境空间,但更多的时候,我们使用的是函数环境空间。函数环境空间,包括以下四方面的内容:原创 2020-08-10 20:15:20 · 408 阅读 · 0 评论 -
R开发(part7)--环境空间
学习笔记,仅供参考,有错必纠文章目录R开发环境空间创建一个空间环境空间的层次结构环境空间的特征R开发环境空间环境空间是R语言中关于计算机方面的底层设计,主要用于R语言的环境加载器。通过环境空间,封装了加载器的运行过程,让使用者在不知道底层细节的情况下,可以任意加载使用到的第三方R语言程序包。在R语言中,不管是变量、对象或者函数,都存在于R的环境空间中,R程序在运行时变量、函数都有自己的运行时空间。R语言的环境(environment)是由内核定义的一个数据结构,由一系列、有层次关系的框原创 2020-08-10 17:51:11 · 279 阅读 · 0 评论 -
R开发(part6)--pryr包
学习笔记,仅供参考,有错必纠文章目录R开发pryr包创建匿名函数fmake_function变量表达式替换比较数据类型查看对象是否被修改快速创建list对象查询环境变量打印调用关系数据绑定R开发pryr包pryr包是一个深层的了解R语言运行机制的工具,可以帮助我们更加贴近R语言的核心。为了能开发出更高级的R语言应用,我们需要更深入地懂R。pryr包的API主要包括内部实现工具、面向对象检查工具、辅助编程函数、代码简化工具等几个方面的功能函数.创建匿名函数f# 创建一个匿名函数f(原创 2020-08-10 14:15:12 · 579 阅读 · 0 评论 -
R开发(part5)--导数计算
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发导数计算一阶导二阶导偏导数R开发导数计算一阶导通过R语言可以使用deriv函数直接进行导数的计算,比如要计算y=x3y=x^3y=x3的导数,根据导数计算公式,用于手动计算的变形结果为y′=3x2y'=3x^2y′=3x2,当x=1x=1x=1时,y′=3y'=3y′=3,当x=2x=2x=2时,y′=12y'=12y′=12。R>dx <- deriv(y ~ myx^3, "myx")R原创 2020-08-09 22:26:42 · 932 阅读 · 0 评论 -
R语言观察日志(part14)--R语言杂记
学习笔记,有错必纠文章目录2020年8月杂记search函数未命名向量化计算ls函数2020年8月杂记search函数search函数可以查看当前环境已加载的R包:R>search() [1] ".GlobalEnv" "package:xts" "package:ggplot2" "package:zoo" [5] "package:caTools" "package:Cairo" "package:formatR" "p原创 2020-08-09 21:46:10 · 313 阅读 · 0 评论 -
R开发(part4)--分布检验与R语言
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发分布检验R开发分布检验均匀分布的分布检验Kolmogorov-Smirnov连续分布检验是检验单一样本是不是服从某一预先假设的特定分布的方法。把样本数据的累计频数分布与特定理论分布相比较,若两者间的差距很小,则推论该样本取自某特定分布族。均匀分布检验的原假设为H0:数据集符合均匀分布;备择假设为H1:样本所来自的总体分布不符合均匀分布。R实现:#生成服从均匀分布的1000个点S <- r原创 2020-08-09 21:41:07 · 1220 阅读 · 0 评论 -
R开发(part3)--概率基础和R语言
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发概率基础和R语言随机变量大数定理R开发概率基础和R语言随机变量在样本空间(1,2,3,4,5)上,生成离散型随机变量x:S <- c(1:5)x <- sample(S, 1)x #输出3在样本空间(0,1)上,生成10个连续随机变量:y <- runif(10, 0, 1)y#输出[1] 0.15249135 0.05233216 0.71627656 0.98695原创 2020-08-09 21:23:35 · 361 阅读 · 0 评论 -
R开发(part2)--R语言中的数学计算
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹文章目录R开发R语言中的数学计算对数加权平均、连乘、差分、秩、任意数、全体数阶乘、组合、排列累加、累乘、最小累积、最大累积正弦、余弦、正切、反正弦、反余弦、反正切复数方程计算R开发R语言中的数学计算对数R>a <- 2R>b <- 4R>c <- exp(1)R>R>#以2为底的对数R>log2(b)[1] 2R>R>#以10为底的对数R&原创 2020-08-09 20:40:05 · 1302 阅读 · 0 评论 -
R开发(part1)--R语言知识体系结构
学习笔记,仅供参考,有错必纠参考自:《R的极客理想》-- 张丹R开发R语言知识体系结构R简介R语言是一门统计语言,主要用于数学建模、统计计算、数据处理、可视化等几个方向,R语言天生就不同于其他的编程语言。R语言封装了各种基础学科的计算函数,我们在R语言编程的过程中只需要调用这些计算函数,就可以构建出面向不同领域、不同业务的、复杂的数学模型。掌握R语言的语法,仅仅是学习R语言的第一步,要学好R语言,需要你要具备基础学科能力(初等数学、高等数学、线性代数、离散数学、概率论、统计学)+业务知识原创 2020-08-09 20:36:57 · 278 阅读 · 0 评论 -
今日代码(200727)--全局空间自相关性
代码笔记参考自:R语言空间统计分析全局空间自相关性基于k最近邻计算莫兰指数#####空间计量#########导包####library(spdep)library(sp)library(rgdal)library(rgeos)####方法区####citysort <- function(cityname, refername) { nameList = c() for (i in 1:length(refername)) { num = w原创 2020-07-27 19:23:41 · 1214 阅读 · 0 评论 -
今日代码(200725)--数据录入(python+mysql)
代码记录数据录入(python+mysql)前言相比于200612代码增加了一个性别、运动员编号、运动员姓名字段。代码# -*- coding: utf-8 -*-import reimport datetimeimport osfrom pandas import DataFrameimport pandas as pdimport pymysqlclass EiDealData: def __init__(self): self.pat原创 2020-07-25 00:49:32 · 230 阅读 · 0 评论 -
R语言观察日志(part13)--从GitHub中下载R包
学习笔记,仅供参考,有错必纠从GitHub中下载R包这里,我们将介绍两种下载并加载R包的方式,即通过在线安装和本地安装。在线安装我们在使用在线安装的方法时,可能会遇到各种各样的问题,这里,我们试着下载R包,来阐述这个问题。JuliaCall包首先,我们需要安装devtools包:install.packages("devtools")如果我们想要下载https://github.com/Non-Contradiction/JuliaCall下的R包(项目名为:JuliaC原创 2020-07-23 12:18:54 · 2612 阅读 · 0 评论 -
RStudio快捷键
学习笔记,仅供参考,有错必纠参考自:官方文档RStudio快捷键ConsoleDescription Windows & Linux MacMove cursor to Console Ctrl+2 Ctrl+2Clear console Ctrl+L Ctrl+LMove cursor to beginning of line Home Command+LeftMove cursor to end of line End Command+RightNavigate c原创 2020-07-23 00:46:54 · 719 阅读 · 0 评论 -
R语言观察日志(part12)--关于.Rprofile文件
学习笔记,仅供参考,有错必纠关于.Rprofile文件帮助文档除非--no-init-file被给出,R会搜索一个用户配置文件,一个包含R代码的文件。这个文件的路径可以由R_PROFILE_USER环境变量指定,如果这个未设置,一个名为.Rprofile的文件会被在当前目录或用户的主目录中(按顺序)搜索。如果在开始时想要一组与默认包不同的包,请在.Rprofile或Rprofile.site文件中插入options选项。例如,options(defaultPackages = charact原创 2020-07-23 00:44:07 · 2989 阅读 · 0 评论 -
R语言观察日志(part11)--好用的R命令之高效安装
学习笔记,仅供参考,有错必纠PS:别看名字是高效安装,还有一些其他方法高效安装命令查看操作系统相关信息Sys.info()输出: sysname release version nodename machine "Windows" ">= 8 x64" "build 9200" "GOAT" "x86-64" login u原创 2020-07-23 00:29:09 · 301 阅读 · 0 评论