自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

山海之间

文体不限,立意自定

  • 博客(22)
  • 收藏
  • 关注

原创 R语言学习10-查看数据

当我们处理一个新的数据集的时候,第一件事就是要对数据做一个了解。数据的格式是什么?数据的维度是多少?变量名是什么? 变量如何存储? 是否缺少数据? 数据中是否有任何缺陷?本次课将学习如何使用R的内置函数回答这些问题以及以及其他更多内容。 我们将使用从美国农业部PLANTS数据库构建的数据集。尺寸和大小假设我们已经把数据读取并存入一个名为plants的变量。我们输入ls...

2020-06-08 01:37:03 9372

原创 R语言学习9-读取表格数据

本次课程,我们学习R中用于读取表格数据的reader包的一些基本功能。有关readr的详细介绍,可以参考*《Mastering Software Development in R》*的1.3节。读取在本课程中,我们将使用美国邮政编码上的一个小型数据集。 该表包含有关美国人口普查局发布的城市邮政编码的百分比的信息。首先,我们使用library()函数载入readr包。...

2020-05-28 14:38:54 3135

原创 R语言学习8-工作空间和文件

在本节课程中,我们学习R中有关工作空间的内容,并探索工作空间和计算机文件系统之间的关系。由于不同的操作系统在诸如文件路径之类的东西上有不同的约定,因此某些命令的输出可能会在不同系统之间有所不同。但是,R提供了用于与文件交互的通用API(一组通用命令),这样我们的代码即可在不同类型的计算机上工作。首先,使用getwd()定R会话将哪个目录用作其当前工作空间。> g...

2020-05-22 20:37:54 491

原创 R语言学习7-逻辑运算

本次课程简要介绍一下R中的逻辑运算。R中有两个逻辑值,也称为布尔值。 它们分别是TRUE和FALSE。 在R中,可以构造逻辑表达式,其结果为TRUE或FALSE。相等创建逻辑表达式需要逻辑运算符,逻辑运算符的功能类似于+、-、*、/等算术运算符。我们首先学习的逻辑运算符是相等运算符,用2个等号表示:==。简单尝试下:> TRUE == TRUE[1] TRU...

2020-05-21 05:04:50 1730

原创 R语言学习6-矩阵和数据框

在本课程中,我们将学习矩阵和数据帧。两者都表示矩形数据类型,这意味着它们用于存储具有行和列的表格数据。这两者的主要区别是,矩阵只能包含一种数据类型,而数据框可以包含多种数据类型。矩阵首先,让我们创建一个1-20的向量my_vector:> my_vector <- 1:20> my_vector [1] 1 2 3 4 5 6 ...

2020-05-20 20:35:09 2701

原创 将博客搬至CSDN

将博客搬至CSDN

2020-05-20 11:09:23 95

原创 R语言学习5-向量子集

在本课程中,我们将了解如何根据指定的条件从向量中提取元素。例如,我们可能只对向量的前20个元素感兴趣,或者仅对非NA的元素感兴趣,或者对正数或与感兴趣的特定变量相对应的那些元素感兴趣。现在有这么一个向量x,里面包含20个服从标准正态分布的数字和20个NA。> x [1] NA NA NA -0.05108979 NA -0.020868...

2020-05-19 00:48:19 669

原创 R语言学习4-缺失值

缺失值在统计和数据分析中起着重要作用。通常,不能简单的忽略缺失值,而应该仔细研究它们,以了解是否存在潜在的模式或缺失的原因。两种缺失值NA在R中,NA用于表示“不可用”或“缺失”(在统计意义上)的任何值。 在本课程中,我们将进一步探索缺失值的价值。任何涉及NA的操作通常都会产生NA。 为了说明这一点,让我们创建一个向量c(44,NA,5,NA)并将其分配给变量x。...

2020-05-18 01:07:34 376

原创 R语言学习3-向量

向量是R语言中最简单也是最常用的数据结构。向量有两种不同的表现形式:原子向量:只包含一种数据类型;列表向量:包含多种数据类型原子向量在上一节教程中,我们学习了数值序列,实际就是原子向量的一种。其他的原子向量还包括:逻辑向量字符向量整数向量复数向量在这节教程中,我们重点了解一下逻辑向量和字符向量。逻辑向量逻辑向量包含的值有:TRUEFAL...

2020-05-13 15:39:40 372

原创 illumina 肿瘤分析流程

本地 Win 电脑部署了一套 ILLUMINA 的肿瘤分析流程,有 DNA 和 RNA 两个流程。需要将这套分析流程部署到 Linux 服务器上。通过查看日志,发现 DNA 的 Workflow 主要有以下几个部分:数据拆分数据拆分: 通过 bcl2fastq 拆分数据(现有流程已有拆分步骤,可忽略);bam 文件处理bwa比对: 将 fastq 文件比...

2020-05-09 16:11:30 1031 1

原创 FastAPI使用小结

以一个实际构建API的例子介绍FastAPI在已有数据情况下的简单应用简介FastAPI是一个现代、快速(高性能)的 Web 框架,基于标准 Python 类型提示,使用 Python 3.6+ 构建 API。主要特征是:高速:与NodeJS和Go相当,拥有高性能。 现有最快的Python框架之一。快速编码:将功能开发速度提高约200%至300%。更少的Bug...

2020-04-23 00:57:50 1055

原创 R语言学习-2-Sequences of Numbers

R语言中生成序列和重复序列的方法Sequences of Numbers学习R中的关于数字序列的一些内容符号 ":" 的用法在R中创建数字序列的最简单方法是使用:运算符,我们在console里输入1:20:> 1:20 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20返回了一个...

2020-04-09 20:48:56 519

原创 R语言学习-1-Basic Building Blocks

使用swirl包来进行R语言的学习,有关swirl的介绍可以看Y叔的这篇公众号文章Basic Building Blocks介绍R中的一些基本模块,所有的命令都可以在R的console里交互式进行。 推荐使用Rstudio进行学习变量R最简单的应用,是可以作为交互式的计算器,在console里输入5 + 7然后回车:> 5 + 7 #输入,R的控制台里输入...

2020-03-30 05:31:53 677

原创 贝叶斯定理

关于贝叶斯的一些介绍逆向概率所谓「逆向概率」是相对「正向概率」而言。正向概率的问题很容易理解,如「假设袋子里面有 N 个白球,M 个黑球,你伸手进去摸一把,摸出黑球的概率是多大」。但是实际场景中,这个问题往往相反:「如果事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一些球,观察这些取出来的球的颜色,我们可以对袋子里面黑白球的比例作出什么样的推测」。贝叶斯推断与其他统...

2020-03-20 17:10:39 247

原创 Git钩子实现自动部署

记录一下使用Git钩子来实现网站的自动部署概念本地仓库:平时开发所在的环境,可以简单的理解为自己的电脑,记为L1远程git服务器:git服务所在的服务器,比如我们自己内部搭建的gitlab服务运行在31服务器上,记为G1远程仓库: 运行仓库代码运行所在的服务器,比如我们的webserver运行的服务器,记为R1在这里,我们的G1和R1恰好是同一台机...

2020-03-20 03:06:22 317 1

原创 UMI简介

关于UMI的一些东西,概念,位置,如何处理UMI是什么UMI全称:Unique Molecular Identifiers。又称分子条形码技术,是对原始样本基因组打断后的每一个片段都加上一段特有的标签序列,用于区分同一样本中成千上万的不同的片段,在后续的数据分析中可以通过这些标签序列来排除由于 DNA 聚合酶和扩增以及测序过程中所引入的错误。分子条形码通常由大约 10...

2019-07-28 19:01:45 11145

原创 Hello Gridea

???? 欢迎使用 Gridea !✍️ Gridea 一个静态博客写作客户端。你可以用它来记录你的生活、心情、知识、笔记、创意... ...GithubGridea 主页示例网站特性???????? 你可以使用最酷的 Markdown 语法,进行快速创作???? 你可以给文章配上精美的封面图和在文章任意位置插入图片????️ 你可以对文章进行标签分组???? 你可以自定义菜单,...

2018-12-12 21:32:25 138

原创 python爬取豆瓣图书Top250

python3.5 爬取豆瓣读书Top250并保存

2017-03-19 21:41:42 3820 4

原创 python操作xlsx文件的包openpyxl

Python扩展库openpyxl,可以操作07版以上的xlsx文件。可以创建工作簿、选择活动工作表、写入单元格数据,设置单元格字体颜色、边框样式,合并单元格,设置单元格背景等等。需要增加可以颜色进入包安装目录的 your_pthon_path/site-packages/openpyxl/styles 修改colors.py文件下的COLOR_INDEX = ( '00000000

2017-03-01 13:33:42 4019

原创 《python数据分析与挖掘实战》笔记-3.1代码问题

问题今天看到《python数据分析与挖掘实战》这本书的第三章的第一份代码,照着书上的代码敲了一遍,发现在异常值处理的部分会报错。x = p['fliers'][0].get_xdata()y = p['fliers'][0].get_ydata()报错信息:TypeError: 'AxesSubplot' object is not subscriptable解决方案解决的方法很简单,只需在使用D

2017-02-24 21:58:21 4188

原创 win下安装Scrapy最新版

系统win7 64位(应该也适用于win10 64位)python 3.5.2 过程一开始打算直接pip安装: pip install Scrapy但是直接pip安装会报错,lxml和Twisted这两个包会提示安装失败,其他的包貌似都直接pip的时候都安装好了…… 所以直接下载whl文件安装,下载地址: 点这里,点这里 推荐直接CTRL-F在页面内寻找你需要的包,基本都是最

2017-02-22 10:35:29 660

原创 python提取GFF3文件信息

前言因为最近使用REPET这个程序对基因组进行重复序列的注释,但是最后输出的结果是GFF3格式的文件,缺少统计信息。因此用python写了个脚本,对GFF3的信息进行提取并统计。GFF3文件想要从GFF3文件中提取的信息为重复序列的种类,数量,以及bp数。 GFF3文件分为9列,这次用到是第2、4、5、9列,分别代表来源,序列起始位置,结束位置,以及属性。 重复序列的种类可以从第9列属性中提取,

2017-02-22 10:26:53 8701

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除