![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 81
genome_denovo
本人从事生物信息分析工作2年,专注于微生物基因组分析领域。
展开
-
python:scikit-learn(1),基本概念
《scikit-learn机器学习 第2版》第1章 机器学习基础机器学习:通过经验学习知道未来决策机器学习分为监督学习和无监督学习监督学习:分类类别已知机器学习的输入称为解释变量,输出称为响应变量组成监督学习经验的实例集合称为训练集,衡量程序性能的实例集合称为测试集常见的监督机器学习有分类和回归分类的响应变量为离散值,回归的响应变量为连续值降维:发现对响应变量变化影响最大的特征过...原创 2020-03-31 15:44:50 · 364 阅读 · 0 评论 -
python:12:模块和包
第一章:python第12节:模块1,模块的概念一个文件被看作是一个独立模块,一个模块也可以被看作是一个文件。模块的文件名就是模块的名字加上扩展名(.py)。2,模块导入及路径导入模块不在搜索路径内,会导致路径搜索失败,模块导入失败; 所以要添加导入模块的搜索路径,在添加的搜索路径下添加模块; 搜索路径保存在sys模块的sys.path变量里,它包含每个独立路径的列表。 >>> import原创 2017-10-25 19:34:07 · 365 阅读 · 0 评论 -
python:利用pandas进行绘图(总结)基础篇
利用python进行数据分析第八章:绘图和可视化pandas绘图总结pandas中的绘图函数(更加详细的绘图资料可参考pandas.pdf文档中的Visualization这一章) >>> import pandas as pd >>> import numpy as np >>> from pandas import Series, DataFrame >>> import matplot原创 2017-10-23 20:04:08 · 85099 阅读 · 3 评论 -
python:11:函数
第一章:python第11节:函数1,函数的简单表现形式:1,用def来创建函数,如def foo():>>> def panduan(): ... ····if raw_input('please input a number:') == 1: ... ········print '1' ... ····else: ... ········print '0' >>> panduan()2原创 2017-10-22 14:21:40 · 430 阅读 · 0 评论 -
python:pandas(7),读写文本格式数据
利用python进行数据分析第六章:数据加载、存储与文本格式NumPy提供了一个低级但异常高效的二进制数据加载和存储机制,而对于pandas的输入与输出划分为几个大类: 读取文本文件和其他更高效的磁盘存储格式, 加载数据库中的数据, 利用Web API操作网络资源。1,读写文本格式的数据表6-1:pandas中的解析函数 | 函数 | 说明 | | read_csv | 从文件、URL、文原创 2017-10-15 18:11:04 · 2644 阅读 · 0 评论 -
python:NumPy基础(4),总结
利用python进行数据分析第四章:NumPy基础:数组和矢量计算总结原创 2017-10-15 17:36:42 · 380 阅读 · 0 评论 -
python:13:python及第三方库的安装
第一章:python第13节:第三方库的安装Python模块的查找和下载;(网址) pypi.python.org Python内置模块的功能查看;(网址) docs.python.orgPython的模块可以按照目录组织成为包 创建一个包的步骤如下: -建立一个包名字的文件夹 -在该文件夹下创建一个__init__.py文件(这个文件内可以没有内容) -根据需要在该......原创 2017-10-28 10:32:11 · 1809 阅读 · 0 评论 -
python:利用pandas进行绘图(总结)绘图格式
22.5 Plot Formatting(绘图格式) 22.5.1 Controlling the Legend(图例管理) You may set the legend argument to False to hide the legend, which is shown by default. 可通过legend=False这个参数选择不显示图例,默认显示 i原创 2017-11-02 20:35:41 · 21711 阅读 · 0 评论 -
python:利用pandas进行绘图(总结)绘图工具
利用python进行数据分析第八章:绘图和可视化pandas绘图工具>>> from pandas.plotting import scatter_matrix >>> from pandas import Series, DataFrame >>> import numpy as np >>> import pandas as pd >>> import matplotlib.pyplot原创 2017-10-30 19:35:52 · 8109 阅读 · 0 评论 -
python:8:文件的输入与输出
第一章:python第八节:文件的输入与输出1,文件的读写形式文件使用模式’r’,’w’及’a’分别表示文件的读取,写入和追加;而’r+’表示以读方式打开。文件的输入(文件内容读取):read():将文件中的所有内容看成一个字符串,并将其读取出来,包括换行符,制表符等,这些字符都算在这一个字符串当中; readline():以行为单位读取文件内容,每次输入readline()读取文件的一行,当所有原创 2017-11-27 20:10:53 · 639 阅读 · 0 评论 -
python:10:错误与异常
第一章:python第九节:错误与异常,try语句1,try-except语句try-except语句可对一段代码进行异常监控,并提供处理异常的机制。 >>> try: ... ····try_suite #监控这里的异常 ... except Exception [, reason]: #监测异常类型 ... ····except_suite #异常处理代码 实例: >>> try:原创 2017-10-21 09:57:38 · 468 阅读 · 0 评论 -
python:脚本:1:AdapterRemoval_statistics_sample.py
#!/usr/bin/env python #coding:utf8 #author:zhounanfrom __future__ import division import os, string, sysif len(sys.argv) != 2: ····print u'python AdapterRemoval_statistics_sample.py name,name,原创 2017-11-22 17:31:04 · 665 阅读 · 0 评论 -
python:9:os模块与sys.argv
第一章:python第八节:执行非python程序的os模块及命令行参数sys.argv1,命令行参数:sys.argv的用法sys模块通过sys.argv属性提供了对命令行参数的访问。 命令行参数是调用某个程序时除程序名以外的其他参数。 在python中,sys.argv代表命令行输入列表的长度,而该列表的第一项sys.argv[0]永远是程序的名称,即该脚本的文件名(例如:原创 2017-10-19 08:08:22 · 779 阅读 · 0 评论 -
python:NumPy基础(3),文件输入输出
利用python进行数据分析第四章:NumPy基础:数组和矢量计算用于数组的文件输入输出1,将数组以二进制格式保存到磁盘np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。 np.save可保存二进制格式数据到文件当中 >>> arr=np.arange(10) >>> np.save('C:\Users\原创 2017-10-14 12:03:31 · 6884 阅读 · 1 评论 -
python:pandas(2),基本功能
利用python进行数据分析第五章:pandas入门第二节,基本功能1,重新索引在pandas中reindex能够创建一个适应新索引的新对象 >>> obj=Series([4.5, 7.2, -5.3, 3.6], index=['d', 'b', 'a', 'c']) >>> obj d 4.5 b 7.2 a -5.3...原创 2017-09-15 08:50:17 · 605 阅读 · 1 评论 -
python:NumPy基础(2),通用函数及数据处理
利用python进行数据分析第四章:NumPy基础:数组和矢量计算通用函数:快速的元素级数组函数通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数。可将其看做简单函数(接受一个或多个标量值,并产生一个或多个标量值)和矢量化包装器。原创 2017-10-10 22:37:53 · 918 阅读 · 0 评论 -
python:4:列表基本用法及相关函数(2)
第一章:python第四节:内建函数,列表字符串转换1,列表类型的内建函数list.append(obj) 向列表中添加一个对象,可以向列表中添加数字,变量,字符串,列表或元组 >>> l=[1,1,2,2,3,3,4,4,5,5] >>> l.append(6) >>> l [1,1,2,2,3,3,4,4,5,...原创 2017-09-06 22:53:45 · 343 阅读 · 0 评论 -
python:3:列表基本用法及相关函数(1)
第一章:python第三节: 列表类型相关函数1,列表基本用法及相关函数列表成员关系(in, not in) 连接操作符,将两个列表合并 重复操作符,列表多次重复 列表内建函数,序列类型函数len(list):列表元素个数 max(list):返回列表元素中的最大值 #对于纯数字的列表 min(list):返回列表元素中的最小值 #对于纯数字的列表 sorted(lis原创 2017-09-06 20:38:07 · 517 阅读 · 0 评论 -
python:2:字符串基本用法及相关函数
第一章:python第二节:符串类型相关函数1,字符串基本用法成员关系,适用于字符串、元组和列表,成员关系分为in、not in 0 <= index <= len(sequence)-1 -len(sequence) <= index <= -1 切片从起始索引到结束索引 包括开始索引,不包括结束索引 (不包括结束索引对应的元素) 字符串格式转化符: %s字符串,原创 2017-09-06 00:00:45 · 577 阅读 · 0 评论 -
python:1:数字类型相关函数
第一章:python第一节:数字类型相关函数type():类型对象 cmp():比较两个对象 str():将数字转换成为字符串 eval():将字符串转化成数字 isinstance():比较两种type类型 del():删除一个对象 +(数字类型表示加法,字符串类型表示合并) * (数字类型表示乘法,字符串类型表示重复) int():转换为整型 float():转换为浮点型,地原创 2017-09-05 23:31:42 · 489 阅读 · 0 评论 -
python:5:字典
第一章:python第五节: 字典及相关函数1,字典基本用法字典是键值的映射关系;在字典中,必须存在键值对,键和值之间必须用冒号分隔 >>> d={} #创建一个空字典 >>> d={'name': 'earth', 'port': 80} #存在两个键值对 可以用内建函数fromkey原创 2017-09-08 20:46:10 · 308 阅读 · 0 评论 -
python:6:集合
第一章:python第六节: 集合1,集合基本概念和用法集合对象是一组无序排列的可哈希的值,即集合当中的每个元素均不重复出现; 可变集合称为:set,不变集合称为:frozenset 即,set()和frozenset() 集合支持in和not in的成员关系,len()函数可查看集合元素个数,for循环可迭代集合成员。1.创建集合 >>> l=['length', 'age', 'leng原创 2017-09-09 12:01:27 · 291 阅读 · 0 评论 -
python:7:循环与迭代
第一章:python第七节:循环与迭代1,循环for循环迭代选取序列元素的三种方式 1.序列项迭代 >>> list1=[1, 2, 3] >>> for a in list1: ... ····print a 1 2 3 2.序列索引迭代 >>> for x in range(len(list1)): ... ····print list1[x] 1 2 3 3.序列项原创 2017-09-09 20:48:15 · 373 阅读 · 0 评论 -
python:pandas(1),数据结构介绍
利用python进行数据分析第五章:pandas入门第一节,pandas的数据结构介绍>>> from pandas import Series, DataFrame >>> import pandas as pd 这两个模块导入是前提1,SeriesSeries是一种类似于一维数组的对象,他由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。 >>> obj=Ser原创 2017-09-11 23:50:33 · 502 阅读 · 0 评论 -
python:pandas(3),汇总和计算描述统计
利用python进行数据分析第五章:pandas入门第三节,汇总和计算描述统计DataFrame当中的一些数学和统计方法 >>> df=DataFrame([[1.4, np.nan],[7.1, -4.5],[np.nan, np.nan], [0.75, -1.3]], index=['a', 'b', 'c', 'd'], columns=['one', 'two']) >>> df ·原创 2017-09-18 08:45:40 · 4641 阅读 · 0 评论 -
python:pandas(4),缺失数据处理
利用python进行数据分析第五章:pandas入门第四节,缺失数据处理pandas使用浮点值NaN(Not a Number)表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测出来的标记而已 >>> string_data=Series(['aardvark', 'artichoke', np.nan, 'avocado']) >>> string_data 0 aardvark原创 2017-09-19 20:08:48 · 1230 阅读 · 0 评论 -
python:pandas(5),层次化索引
利用python进行数据分析第五章:pandas入门第五节,层次化索引层次化索引(hierarchical indexing)可使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。 >>> data=Series(np.random.randn(10), index=[['a', 'a', 'a', 'b', 'b',...原创 2017-09-20 08:17:52 · 2140 阅读 · 0 评论 -
python:pandas(6),用法及函数总结
利用python进行数据分析第五章:pandas入门第六节,pandas用法及函数总结SeriesSeries(list) #产生一个一维数组 obj=Series(list) obj.values #取Series的值 obj.index #取Series的索引自定义index obj2=Series(list1, index=list2) #Series...原创 2017-09-21 22:45:17 · 938 阅读 · 0 评论 -
python:matplotlib及pandas绘图(1)
利用python进行数据分析第八章:绘图和可视化matplotlib APL入门>>> import matplotlib.pyplot as plt >>> import numpy as np >>> import pandas as pd1,Figure和Subplotmatplotlib的图像都位于Figure对象中,可通过plt.figure创建一个新的Figure >>> fig=原创 2017-09-27 23:13:50 · 2053 阅读 · 1 评论 -
python:matplotlib及pandas绘图(2)
利用python进行数据分析第八章:绘图和可视化pandas中的绘图函数比较matplotlib和pandas发现,matplotlib进行绘图需要多种组建进行数据展示,通常制作一张完整的图需要用到多个对象。相比之下pandas有许多能够利用DataFrame对象数据组织特点来创建标准图表的高级绘图方法。 >>> import pandas as pd >>> import numpy as n原创 2017-10-02 15:24:40 · 3401 阅读 · 0 评论 -
python:NumPy基础(1),ndarray多维数组对象
利用python进行数据分析第四章:NumPy基础:数组和矢量计算精通面向数组的编程和思维方式是成为Python科学计算牛人的一大关键步骤。NumPy的ndarray:一种多维数组对象ndarray是一个通用的同构数据多维容器,也是N维数组对象。重点在于其中的所有元素必须是相同类型。每个数组都有一个shape(一个表示各维度大小的元组,即几行几列)和一个dtype(一个用于说明数组数据类型的对象)1原创 2017-10-03 16:40:50 · 1048 阅读 · 0 评论