- 博客(45)
- 收藏
- 关注
转载 python 读取Excel文件
#导包import xlrdfile= u'D:\\test\\学信网zh.xlsx'xlrd.open_workbook(file)们在解析Excel 表格时 ,主要利用的是一个类似二维数组的方式,一般的Excel表格,第一行一般是表头,,如果你的没有表头那就解析起来更加简单。我们以有表头的为例:#-*- coding=utf-8 -*-import xlrddef open_e...
2018-04-28 16:09:42 244
转载 Python使用filetype精确判断文件类型
filetype.pySmall and dependency free Python package to infer file type and MIME type checking the magic numbers signature of a file or buffer.This is a Python port from filetype Go package. Works in ...
2018-04-27 17:20:56 6163
原创 离群点检测
1.单变量离群点检测> set.seed(3147)> x <- rnorm(100)> summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. -3.3150 -0.4837 0.1867 0.1098 0.7120 2.6860 > boxplot.stats(x)$out[1] -3....
2018-04-27 14:38:11 2686
原创 R 语言图形函数 par()参数应用举例
函数 par()中的参数可以分为三大类:(1) 只可以查询而不可以修改的参数, 即 readonly 参数: "cin", "cra", "csi", "cxy", "din"和 "page"。(2)只能通过 par 函数进行设置的参数: "ask", "fig", "fin", "lheight", &
2018-04-27 14:29:51 7745
原创 union(并),setdiff(差),intersect(交)R语言含义
union(并)求两个向量的并集 集合可以是任何数值类型union(x=1:3, y=2:5) [1] 1 2 3 4 5union(x=c("abc", "12"), y=c("bcd", "efg")) [1] "abc" "12""bcd" "efg"setdiff(差)求向量x与向量y中不同的元素(只取x中不同的元素) setdiff(x,
2018-04-26 17:57:30 1142
原创 R中ifelse、which、%in%的用法
在R学习过程中,遇到了ifelse、which、%in%,下面分别举例,说明他们的用法。1、ifelseifelse(test, yes, no)test为真,输出yes值,否则输出no值。举例如下:> x <- c(1,1,1,0,0,1,1)> ifelse(x != 1, 1, 0) #若果x的值不等于1,输出1,否则输出0[1] 0 0 0 1 1 0 02、which用...
2018-04-26 17:46:02 471
转载 python文件和目录操作方法大全(含实例)
这篇文章主要介绍了python文件和目录的操作方法,简明总结了文件和目录操作中常用的模块、方法,并列举了一个综合实例,需要的朋友可以参考下:一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个文件:os...
2018-04-25 10:18:01 305
原创 序列输入// 输出
1 分析或读取序列 Bio.SeqIO.parse()将序列数据读成 SeqRecord 对象。它有两个参数:第一个参数是要读取的 handle。handle 是一个要读的打开文件,但是可以从命令行输出,或者可以从网上下载。第二个参数是一个小写的序列特征格式--我们不会为你猜想文件格式。到http://biopython.org/wiki/SeqIO 查 看 支 持 的 文 件 格...
2018-04-23 09:09:15 1735 1
原创 序列对象
生物信息学中的主要对象毫无疑问就是生物序列,在本章中,我们将介绍Biopython 中的技巧来处理序列--Seq 对象。 序列从本质上将是像 AGTACACTGGT 这样的一系列字母,这看上去很自然,因为这是生物学文件格式中所看到的序列的最常见方式。 在 Seq 对象和python 序列间有两个重要的不同点。 首先, Seq 对象包含有...
2018-04-22 16:52:02 863
转载 Ubuntu中安装Biopython
Biopython 是Python的计算分子生物学和生物信息学工具包,它使得python在生物学数据处理中变得更加强大和高效,在Windows中安装biopython非常简单,下载之后,双击然后一路点下一步就可以了。 在Linux中安装有多种方法,以Ubuntu(10.04)为例:方法一:使用apt-get install方式安装 sudo ap...
2018-04-22 13:26:14 2101
原创 聚类
1.K-means聚类将iris数据集上演示K-means聚类的过程,首先要从iris数据集中移除Species属性,然后再对数据集iris2调用函数,并将聚类结果储存在变量kmeans.result中。> attach(iris)> iris2 <- iris> iris2$Species <- NULL> (kmeans.result <- kme...
2018-04-20 14:34:14 500
转载 回归分析
R语言进行回归分析 回归分析是对多个自变量(预测变量)建立一个函数来预测因变量(响应变量)的值。如银行根据房贷申请人的年龄,收入,开支,职业,负担人口以及整体信用限额等因素来评估申请人的房贷风险。 ...
2018-04-19 10:01:41 866
转载 R语言绘制热图——pheatmap
R语言绘制热图——pheatmap pheatmap简介: Pretty Heatmaps——Implementation of heatmaps that offers more control over dim...
2018-04-18 17:12:39 8836
转载 R语言与热图分析
一文详解如何用 R 语言绘制热图 简介本文将绘制静态与交互式热图,需要使用到以下R包和函数:● heatmap():用于绘制简单热图的函数● ...
2018-04-17 15:36:56 47276 1
原创 linux下安装7z命令及7z命令的使用
linux下安装7z命令及7z命令的使用本文主要介绍了在linux下安装7z命令的方法,同时介绍了7z命令的使用。7z压缩格式拥有众多优点,具有极高的压缩比率,如果你还不了解,请看文章:7z格式、LZMA压缩算法和7-Zip详细介绍。reille使用的linux发行版是ubuntu,同时在Redhat上业已验证,可正常使用。1. linux安装7z命令linux上安装7z命令有两种方式:在线安装和...
2018-04-16 18:02:24 372
原创 随机森林
随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标。根据下列算法而建造每棵树:用N来表示训练用例(样本)的个数,M表示特征数目。输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并...
2018-04-16 17:01:53 893
原创 决策树
1. 使用party包构建决策树 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。 由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entr...
2018-04-16 16:33:58 776
原创 数据更多探索
3D散布图> library(scatterplot3d)Warning message:程辑包‘scatterplot3d’是用R版本3.3.3 来建造的 > scatterplot3d(iris$Sepal.Width,iris$Sepal.Length,iris$Petal.Width)交互式> plot3d(iris$Petal.Width,iris$Sepal....
2018-04-16 10:35:26 655
原创 R语言中描述统计量的多种方法summary()、describe()、str()等
1.查看数据> dim(iris)[1] 150 5> names(iris)[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" [5] "Species" > str(iris)'data.frame': 150 obs. of 5 variables: $ Sep
2018-04-13 17:05:54 31661 1
原创 数据的导入和导出
1. R数据的保存和加载> a <- 1:10> save(a, file = "temp.Rdata")> rm(a)> load("temp.Rdata")> a [1] 1 2 3 4 5 6 7 8 9 102. csv文件的导入和导出> var1 <- 1:5> var2 <- 1:5 /
2018-04-13 15:53:46 536
原创 数据集
数据挖掘的主要技术包括分类与预测,聚类,离散点检测,关联分析,序列分析,时间序列分析和文本挖掘,可能还有社交网络分析和情感分析分析要用到的数据集有:> str(iris)'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal....
2018-04-13 15:20:52 429
原创 R语言的数据类型
1.向量与数据类型生成数据> numeric(25) [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0[24] 0 0> character(25) [1] "" "" "" "" "" "" "" "" "" "" &
2018-04-13 14:53:01 300
原创 回归与相关性
1.简单线性回归通过线性回归来描述连个变量之间的联系。函数lm(linear model,线性模型)可以用来进行线性回归分析。> attach(thuesen)> lm(short.velocity~blood.glucose)Call:lm(formula = short.velocity ~ blood.glucose)Coefficients: (Intercep...
2018-04-13 14:04:43 2021
原创 单样本和双样本的检验
1.1 单样本t检验t检验假设数据来自于一个正态分布。> daily.intake <- c(5260, 5470, 5640, 6180, 6390, 6515, 6805, 7515, 7515, 8230, 8770)> mean(daily.intake)[1] 6753.636> sd(daily.intake)[1] 1142.123> quan...
2018-04-12 12:53:01 8318
原创 R语言概率与分布
1.1 随机抽样在R中,函数sample模拟随机抽样,(sample的默认行为是无放回抽样,加上replace=T放回抽样,prob函数调节概率)> sample(1:40,5)[1] 6 33 8 22 11> sample(40,5)[1] 18 34 11 1 25> sample(40,5,replace = TRUE)[1] 15 5 11 22 1...
2018-04-12 12:27:07 4092
原创 R客户端RStudio快捷键大全
r语言客户端RStudio快捷键大全中文版ConsoleDescription Windows & Linux Mac将光标定位到控制台 Ctrl+2 Ctrl+2清空控制台 Ctrl+L Command+L将光标定位到行首 Home Command+Left将光标定位到行末 End Command+Right在历史命令中导...
2018-04-12 10:27:44 6207
原创 R语言基础
# 大型计算机# 赋值# 向量运算# R语言----表达式和对象/调用函数的格式是函数名后面由圆括号包含起来的一个或者几个参数。# 引用和转义序列cat (c("A", "B","C","\n" "c")) # \n 转义序列(换行)cat("What is \"R\" ? ") #\ 转移字符# 生成向量的函数:c(concatenate)把各分项首尾连接、seq
2018-04-12 10:06:09 651
原创 远程登陆
终端利用ssh登录远程服务器安装ssh:yum install ssh启动ssh:service sshd start登录远程服务器:ssh -p 50022 my@127.0.0.1输入密码:my@127.0.0.1:-p 后面是端口my 是服务器用户名127.0.0.1 是服务器 ip回车输入密码即可登录exit 命令退出远程登陆...
2018-04-10 21:05:59 148
转载 Linux下*.tar.gz文件解压缩命令
Linux下*.tar.gz文件解压缩命令 转自:http://www.cnblogs.com/xiehy/archive/2010/09/13/1824776.html1.压缩命令: 命令格式:tar -zcvf 压缩文件名.tar.g...
2018-04-10 21:02:54 911
原创 随机数的处理
首先载入随机数的工具包import random导入模块后,可以直接在模块名称后面敲一个Tab键,会提示该模块中所有的函数random(a,b) a<b ,随即产生整数a,b直接的任意数注意: 在导入工具包时,应该将导入的语句放在文件的顶部import randomplayer = int(input("请输入你要出的拳 石头(1)/ 剪刀(2)/ 布(3)"))computer = r...
2018-04-10 20:09:25 560
原创 逻辑运算
逻辑运算在程序开发的中,判断条件时,会同时需要判断多个条件,当都满足时,才能执行后续代码。逻辑运算符 可以把 多个条件 按照 逻辑 进行 连接,变成 更复杂的条件and /or/notand (与/并且,两个条件都满足时,返回True,一个不满足就返回False)条件1 and 条件2or (或者,其中有一个满足,返回Ture, 都不满足返回False)not(非,代表相反的情况)# 定义一个整数...
2018-04-10 17:09:17 410
原创 软链接
命令 ln -s 被链接的源文件链接文件作用是建立文件的软链接,相当于windows下的快捷方式没有-s建立的会死硬链接,虽然两个文件占相同的空间大小,但是工作汇中不会建立硬链接,源文件要使用绝对路径,方便移动链接文件后还可以使用。...
2018-04-10 15:56:17 356
原创 判断语句
现实生活中的判断很多,程序中的判断就是对生活中的判断进行抽象。判断如果条件满足,才能做某件事如果条件不满足,就做另外一件事或者什么都不做判断语句又被称为“分支语句”,正是因为有了判断才会让程序有了很多分支if判断语句的基本语法if 要判断的条件: 条件成立时,要做的时 ......else: 条件不成立时要做的事情代码的缩进为一个 tab键或者4个空格注意if语句以及缩...
2018-04-10 14:41:30 236
原创 变量的命名
标志符标志符就是程序员定义的变量名,函数名,需要有见名知义的效果标志符可以由字母,下划线和数字组成,不能以数字开头,不能与关键字重名关键字关键字就是在python内部已经使用的标志符,有特殊的功能和含义,开发者不允许和关键字相同的名字的标志符,通过以下命令可以查看python中的关键字In [1]: import keyword # 载入一个工具包In [2]: print(keyword.k...
2018-04-10 10:47:58 184
原创 变量的格式化
在python中用print函数将信息输出到控制台如果在输出文字信息的同时,一起输出数据,就需要使用到 格式化操作符% 被称为格式化操作符 %s 格式化字符串,%d 有符号十进制整数,%06d表示输出的整数显示位数,不足的用0补全%f 浮点数,%。02f表示小数点后只显示两位%% 输出% # 定义一个字符串 name, 输出 我的名字叫 小明 ,请多多关照!name = "大明...
2018-04-10 10:30:08 332
原创 程序执行的原理
算数运算符+ - * / 加减乘除 // 取整除 % 取余数 ** 幂在python中*运算符还可以用于字符串,计算结果就是字符串重复指定的次数的结果程序执行的原理01 计算机中的三大件:CPU 中央处理器,是一块超大规模的集成电路,负责处理数据/计算内存 临时存储数据(断电之后,数据会消失),速度块,空间小(单位价格高)硬盘 永久存储数据,速度满,空间大(单位价格底)02 程序执行的原理程序...
2018-04-09 20:58:14 883
原创 多文件项目的演练
目标:在项目中添加多个文件夹,并且设置文件的执行开发项目 就是开发一个专门解决复杂业务功能的软件通常每一个项目就具有一个独立专属的目录,用于保存 所有和项目相关的文件一个项目有很源文件。多文件项目的演练1:在01_python基础 的项目中新建一个 lee_02_第二个python程序.py2: 在ee_02_第二个python程序.py文件中添加一句print("hello python")3:...
2018-04-09 17:14:28 230
转载 Python风格规范
Python风格规范分号Tip不要在行尾加分号, 也不要用分号将两条命令放在同一行.行长度Tip每行不超过80个字符例外:长的导入模块语句注释里的URL不要使用反斜杠连接行.Python会将 圆括号, 中括号和花括号中的行隐式的连接起来 , 你可以利用这个特点. 如果需要, 你可以在表达式外围增加一对额外的圆括号.Yes: fo...
2018-04-09 17:08:53 184
转载 第一个python程序
1.1 Python 源程序的基本该概念1:python源程序就是一个特殊格式的文本文件,可以用任何文本编辑器软件做朋友python的开发2:python程序的文件扩展名通常是.py1.2 演练步骤在桌面下,新建 认识python目录在认识python目录下新建 01-hellopython.py文件使用gedit编辑01-hellopython.py,并输入一下内容:print("hello p...
2018-04-09 16:32:35 318
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人