numpy
晓东邪
扎实基础,记录学习点滴。
展开
-
python科学运算库numpy,pandas学习记录
Python中对数组修剪至少可以通过两种方式:>>> import numpy as np>>> >>> a = np.arange(10)>>> aarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])>>> a[a>5] = 5 #方法1:通过布尔判断剔除不合要求的值>>> aarray([0, 1, 2, 3, 4, 5, 5, 5, 5, 5])>>>原创 2016-10-27 21:11:57 · 4933 阅读 · 0 评论 -
使用numpy截取连续的测试集及剩余作为训练集
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址本来想从numpy中找一个可以将array格式的数据提取出连续的测试集,其余作为训练集的函数,但是没找到,就自己写了几个,记录之~import numpy as np"""utils: 用于截取连续的测试集及剩余作为训练集"""def trunc(arr, start, e...原创 2018-02-27 17:51:43 · 1422 阅读 · 0 评论 -
将m行*n列数组转换为最大值为1最小值为0的相同shape数组
今天遇到个问题,给定一个m行*n列数组,将每行中最大值转换为1, 最小值转换为0,返回相同shape的一个数组,初遇到纠结了一会儿,不过很快也就搞定了,方法主要有2个, 如下:In [54]: import numpy as npIn [55]: arr = np.random.randn(10, 5)In [56]: arrOut[56]: array([[ 0.18857493, 0.46原创 2017-08-03 15:57:33 · 9013 阅读 · 0 评论 -
sklearn通过OneVsRestClassifier实现svm.SVC的多分类
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址svm.SVC 支持向量机分类是一个很有效的分类方式,但是其只对2分类有效,不过,可以将多分类经过多次2分类最终实现多分类,而sklearn中的multiclass包就可以实现这种方式,减少我们重复造轮子。import numpy as npfrom sklearn.datasets imp...原创 2017-07-28 10:10:18 · 26963 阅读 · 4 评论 -
jupyter notebook中美化pandas中DataFrame的输出
在jupyter notebook中调用pandas时,DataFrame可以被很好的显示,是这个样子的:虽然比idle或者别的终端输出要好看很多,但是具体想查看符合某特定条件的还是需要不能很好的直接显示出来,实际上比较新的版本下,pandas支持一个style 的方法:1、利用style 和applymap 给特定值显示改变颜色1.1 如果只想对指定列进行颜色改变 2、利用style和apply原创 2017-05-05 14:33:10 · 29448 阅读 · 10 评论 -
sklearn中的Pipeline
一般来说,使用sklearn建模时步骤如下: 0、start 1、分隔训练集和测试集(和验证集) 2、数据预处理 3、模型选择 4、使用GridSearchCV进行参数寻优 5、end其中,数据预处理部分可能需要先fit_transform再transform,相对较为繁琐,此时可以通过Pipeline(管道)进行流水线处理。 代码讲解如下:#导入需要的包In [296]: impo原创 2017-08-10 11:43:49 · 24456 阅读 · 0 评论 -
python取数作为临时极大值(极小值)
编程中有时候需要一个初始极大值(或极小值)作为temp,当然可以自定义设置为10000(whatever),不过python中有一个值可以代替之:在python2.7中可以用这个(不过python3版本就没得了)>>> import sys>>> sys.maxint2147483647还可以利用numpy库(这个python3也可以使用,当然先确认安装了numpy)>>> import num原创 2017-08-10 10:13:38 · 12318 阅读 · 0 评论 -
时间序列中Hurst指数的计算(python代码)
在做时间序列分析时,需要计算Hurst指数,由于Hurst指数计算比较复杂,刚开始懒得自己写,就在github上进行搜索,多是这个代码:from numpy import std, subtract, polyfit, sqrt, logdef hurst(ts): """Returns the Hurst Exponent of the time series vector ts"""原创 2017-04-26 14:22:50 · 29834 阅读 · 22 评论 -
numpy中np.nan(pandas中NAN)
在处理数据时遇到NAN值的几率还是比较大的,有的时候需要对数据值是否为nan值做判断,但是如下处理时会出现一个很诡异的结果:import numpy as npnp.nan == np.nan#此时会输出为False对np.nan进行help查看,输出如下:Help on float object:class float(object) | float(x) -> floating point原创 2017-01-11 23:02:16 · 74088 阅读 · 12 评论 -
pandas中Series,DataFrame的连接(拼接)
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址上一篇中介绍了numpy中数组的拼接方式:numpy中数组的拼接 ,接下来介绍另一个数据处理库pandas中最常用的Series和DataFrame对序列和表格的操作 concat 如numpy中数组的拼接 中所讲是numpy中concatenate的变种,两个使用方法一致。 ...原创 2017-05-13 01:15:34 · 130372 阅读 · 0 评论 -
numpy中数组的拼接
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址python中的科学计算包numpy是一个非常好的扩展工具,numpy中最常见的就是针对数组ndarray的操作,部分操作与python内置的list(其拼接方式为append和extend)有重合,不过要注意使用方式,除此之外,针对ndarray进行数组拼接时有其自己的方式.接下来介绍我所知...原创 2017-05-13 00:11:21 · 61968 阅读 · 1 评论 -
python学习中遇到的一些“神方案”
1、用一行表达式将A= [[1,2,3], [4,5,6], [7,8,9]]转置。(拓展到任何n*m数组)方法1:[[i,j,k] for i,j,k in zip(*A)]方法2:list(map(list,zip(*A))) #这个简直妙方法3:import numpy as npnp.array原创 2016-11-16 22:06:51 · 4173 阅读 · 0 评论 -
使用matplotlib绘制3D立方体图
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址使用matplotlib绘制3D立方体图(含两种样式)# -*- coding: utf-8 -*-# @Author: xiaodong# @Date: just hide# @Last Modified by: xiaodong# @Last Modified time...原创 2018-04-04 14:54:08 · 17991 阅读 · 6 评论