邵露露-CSDN博客

原创 python argparse模块小练习--Python脚本实现linux命令的功能

很简单，下面是我写的代码，实现了 ll -a ll -h 的功能：这个脚本可以实现： Python test.py –a (+任意路径) Python test.py –h (+任意路径)import osimport argparseparser=argparse.ArgumentParser() #创建实例parser.add_argument("--a",nargs='?',de

2017-12-22 12:15:25 501

原创《机器学习实战》学习笔记——K-近邻算法（KNN）(二)海伦约会网站匹配实战

《机器学习实战》中KNN算法实例一：关于这个实战的故事背景可以搜索“海伦约会网站”基本上就可以了解。这个实验的目的是根据已有的海伦整理出来的约会对象的资料和海伦对约会对象的评价，构造分类器，使对新的约会对象进行自动分类（不喜欢的人，魅力一般的人，极具魅力的人）。数据准备海伦准备的约会数据datingTestSet.txt，我已上传github 我们可以先看一下截图：文件一共有四列，每

2017-12-18 01:03:13 1719

原创《机器学习实战》学习笔记——K-近邻算法（KNN）(一)分类器的简单实现

KNN的工作原理是：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k

2017-12-16 16:17:00 758

原创 pandas 选取子集的操作

前段时间学习了pandas,也做了一些练习，今天做一下梳理。 pandas 中对于axis的理解在对dataframe操作的时候，很多时候涉及到了axis的设置，我找到一幅图很好的能理解axis：数据准备读取otu.txt表并且选取5行5列import pandas as pddf = pd.read_csv("otu_taxon.txt",header=0,index_col=0,sep="\

2017-12-11 13:26:49 16685

原创使用python计算方差——pandas.series.std()

这篇博客简单展示一下pandas里怎么计算方差：官方文档： http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.std.htmldef def_std(df): for ix,row in df.iterrows(): std = row.std() df.loc[ix,"std"] = s

2017-12-08 22:34:12 15772

原创使用Vegan包进行生态学数据排序分析的学习（一）

基本概念与分析原理的理解做生物信息以来一直对排序等的概念不是特别理解。这两天查了几篇资料，梳理了一下，做一下简要的总结。 1.排序：假设我们有一个OTU表：行为样本，列为OTU（也可以理解为特征）。我们要对这4个样本进行排序：假如只有一个otu: 那么根据这一个OTU在每个样本中的值就可以排序啦。假如有两个OTU（otu_9,otu72）：我们

2017-12-07 23:30:13 16810

原创 python里使用iterrows()对dataframe进行遍历

假设我们有一个很简单的OTU表：现在对这个表格进行遍历，一般写法为：import pandas as pdotu = pd.read_csv("otu.txt",sep="\t")for index,row in otu.iterrows(): print index print row这里的iterrows()返回值为元组,(index,row) 上面的代码里，for循环定义了

2017-12-06 23:10:29 140028

原创 R paste()函数的使用

在R中，paste() 函数主要是用于字符串连接。 paste()函数的使用非常简单，下面简单举例：for (i in 1:5){ string<-paste("abc",i,"de",sep="") print(string)}for (i in 1:5){ string<-paste("abc",i,"de") print(string)}输出: 注意，sep=”“，还

2017-12-06 22:47:23 25399

原创关于NMDS的一知半解

最近阅读了一下NMDS的相关资料，自己梳理了一下并做出简要总结： NMDS的目的是想要把复杂的多维空间的点，降维后（通常是二伟）展示出来。类似的降维展示有PCA，但是与PCA不同。 PCA是采用了欧氏距离（欧氏距离什么的我还不太懂，后续会继续研究，欢迎大家和我讨论） NMDS 是依据排列顺序（rank order）来定义距离。 NMDS 的

2017-12-05 14:43:01 15350

原创使用R，ggplot2绘制NMDS图

使用R，ggplot2绘制NMDS图输入文件准备mapping.txt ：样品名与分组信息 otu.txt : otu表文件下载 : https://github.com/tangshanshaolu/R_test.git代码部分library(vegan)library(ggplot2)pdf("nmds.pdf")otu<-read.table("otu.txt",heade

2017-12-05 12:21:41 26092

weixin_38605247的博客