- 博客(87)
- 资源 (29)
- 收藏
- 关注
转载 【Python学习心得】Python数据分析几个比较常用的方法
1,表头或是excel的索引如果是中文的话,输出会出错解决方法:python的版本问题!换成python3就自动解决了!当然也有其他的方法,这里就不再深究2,如果有很多列,如何输出指定的列?需求情况:有的时候,数据很多,但是只要仅仅对部分列的数据进行分析的话,要怎么做?解决方法:df =pandas.read_excel('1.xls',
2017-12-31 16:54:47 1294
转载 Python数据分析_Pandas06_窗函数
窗函数(window function)经常用在频域信号分析中。我其实不咋个懂,大概是从无限长的信号中截一段出来,然后把这一段做延拓变成一个虚拟的无限长的信号。用来截取的函数就叫窗函数,窗函数又分很多种,什么矩形窗、三角窗、高斯窗。在scipy.signal中有各种我不懂的实现窗函数的方法。浏览了一下,头疼的紧。那在pandas中也有实现窗函数的方法:rolling()。我呢就不折腾什么信号处
2017-12-31 16:48:59 1171
转载 Python中numpy.clip();numpy.fabs()的用法;以及math.pow()的说明
在看一些关于关于数据分析的Python代码时,时常会出现一些方法不懂其意思,今天做个小小的说明关于:python中numpy.clip()方法的运用、numpy.fabs()方法运用法以及math.pow()的运用numpy.clip(a,a_min,a_max,a=None)的运用:方法解释:Clip(limit)the values in the array.这个方法会给出一个区间,在
2017-12-31 16:45:25 4394 1
转载 使用Python的pandas-datareader包下载雅虎财经股价数据
0 准备工作首先,使用pip方法安装pandas和pandas-datareader两个功能包. 安装的方法十分简单,以管理员身份运行cmd. 输入以下命令。$ pip install pandas$ pip install pandas-datareader需要注意的是,安装pandas时将自动安装numpy等功能包,因此可以使用pandas即代表安装了numpy功能包。今后,在安装所有
2017-12-31 15:56:04 3743
转载 Pandas之sort_values isin使用技巧
1.在pandas的DataFrame中,我们经常需要根据某属性来选取指定条件的行,这时isin方法就特别有效。[python] view plain copyimport pandas as pd df = pd.DataFrame([[1,2,3],[1,3,4],[2,4,3]],index = ['one','two','thr
2017-12-31 14:09:30 1084
转载 Python编程之numpy库函数in1d的使用
最近利用Python作数值分析时使用到numpy库下的in1d函数。in1d函数与excel中vlookup函数和MATLAB中ismember函数有相似之处。其作用在于在序列B中寻找与序列A相同的值,并返回一逻辑值(True,False)或逻辑值构成的向量。具体例子见下文。 设mask为逻辑值向量,矩阵x的第一列为待查找向量,d为被查询向量(或值),即查找x中与d中指定元素
2017-12-30 19:50:00 2025
转载 numpy中meshgrid的使用
meshgrid函数通常在数据的矢量化上使用,但是使用的方法我暂时还不是很明确。而meshgrid的作用适用于生成网格型数据,可以接受两个一维数组生成两个二维矩阵,对应两个数组中所有的(x,y)对。接下来通过简单的shell交互来演示一下这个功能的使用,并做一下小结。 交互显示:In [65]: xnums =np.arange(4) In [66]:
2017-12-30 16:47:42 357
转载 Numpy中的transpose函数
transpose()的操作对象是矩阵。我们用一个例子来说明这个函数: [[[0 1] [2 3]][[4 5] [6 7]]]这是一个shape为(2,2,2)的矩阵,现在对它进行transpose操作。 首先我们对矩阵的维度进行编号,上述矩阵有三个维度,则编号分别为0,1,2,而transpose函数的参数输入就是基于这个编号的,如果我们调用transp
2017-12-30 15:25:43 594
转载 Python 中的几种矩阵乘法 np.dot, np.multiply, *
1. 同线性代数中矩阵乘法的定义: np.dot()np.dot(A, B):对于二维矩阵,计算真正意义上的矩阵乘积,同线性代数中矩阵乘法的定义。对于一维矩阵,计算两者的内积。见如下Python代码:import numpy as np# 2-D array: 2 x 3two_dim_matrix_one = np.array([[1, 2, 3], [4, 5, 6]])#
2017-12-30 15:12:19 431
转载 numpy ix_ 学习记录
官网上给出的例子>>> a = np.arange(10).reshape(2, 5) >>>a array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]]) >>>ixgrid = np.ix_([0, 1], [2, 4]) >>>ixgrid (array([[0], [1]]), array([[2, 4]])) #也就是说
2017-12-30 14:50:17 656
转载 为什么0.1+0.2=0.30000000000000004而1.1+2.2=3.3000000000000003?
文章讨论了计算机中的浮点运算问题,给出了各种不同语言的浮点输出。浮点数运算你使用的语言并不烂,它能够做浮点数运算。计算机天生只能存储整数,因此它需要某种方法来表示小数。这种表示方式会带来某种程度的误差。这就是为什么往往 0.1 + 0.2 不等于 0.3。为什么会这样?实际上很简单。对于十进制数值系统(就是我们现实中使用的),它只能表示以进制数的质因子为分母的分数。
2017-12-30 10:58:25 6599 2
转载 Json对象和Json字符串的区别
SON对象有时候在做项目的时候时常将这两个概念弄混淆,尤其是在使用springmvc的时候,后台@RequestBody接受的是一个json格式的字符串,一定是一个字符串。 先介绍一下json对象,首先说到对象的概念,对象的属性是可以用:对象.属性进行调用的。例如: var person={"name":"tom","sex":"男","age":"24"}//json对象 co
2017-12-29 13:43:51 365
转载 [备忘] Mysql操作出现Error writing file '/tmp/MYAkvdjr'错误
今天下午改了一下自己正在写的LazyCluster聚类脚本,从rcpt数据库里导出mx记录,在select语句后面加了一个order by条件,结果脚本跑了一阵子就报错了: Traceback (most recent call last): File "./contCluster.py", line 621, in main() File "./contC
2017-12-29 13:17:12 2657
转载 python json.dumps() json.dump()的区别
以前写的很简单,只有几句话,最近发现本文是本博客阅读量最大的一篇文章,觉得这样有种把人骗进来的感觉,于是又细化了一些。如果还有不好的地方,欢迎指出。 首先说明基本功能:dumps是将dict转化成str格式,loads是将str转化成dict格式。dump和load也是类似的功能,只是与文件操作结合起来了。 看代码实例:
2017-12-28 17:58:24 373
转载 Python之mmap内存映射模块(大文本处理)说
http://www.cnblogs.com/zhoujinyi/p/6062907.html背景: 通常在UNIX下面处理文本文件的方法是sed、awk等shell命令,对于处理大文件受CPU,IO等因素影响,对服务器也有一定的压力。关于sed的说明可以看了解sed的工作原理,本文将介绍通过python的mmap模块来实现对大文件的处理,来对比看他们的差异。
2017-12-26 15:25:14 1063
转载 Python File fileno() 方法
概述fileno() 方法返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。语法fileno() 方法语法如下:fileObject.fileno(); 参数无返回值返回文件描述符。实例以下实例演示了 fileno() 方法的使用:#!/usr/bi
2017-12-26 10:28:40 2303
转载 Python的hasattr() getattr() setattr() 函数使用方法详解
hasattr(object, name)判断一个对象里面是否有name属性或者name方法,返回BOOL值,有name特性返回True, 否则返回False。需要注意的是name要用括号括起来 1 >>> class test(): 2 ... name="xiaohua" 3 ... def run(self): 4 ... r
2017-12-25 10:54:34 281
转载 Python中time模块与datetime模块在使用中的不同之处
这篇文章主要介绍了Python中time模块与datetime模块在使用中的不同之处,是Python入门学习中的基础知识,需要的朋友可以参考下Python 中提供了对时间日期的多种多样的处理方式,主要是在 time 和 datetime 这两个模块里。今天稍微梳理一下这两个模块在使用上的一些区别和联系。time在 Python 文档里,time是归类在G
2017-12-24 15:47:26 1045
转载 Python time strftime()方法
描述Python time strftime() 函数接收以时间元组,并返回以可读字符串表示的当地时间,格式由参数format决定。语法strftime()方法语法:time.strftime(format[, t])参数format -- 格式字符串。t -- 可选的参数t是一个struct_time对象。返回值返回以可读字符串
2017-12-24 15:28:24 969
转载 分布式队列神器 Celery
Celery 是什么?Celery 是一个由 Python 编写的简单、灵活、可靠的用来处理大量信息的分布式系统,它同时提供操作和维护分布式系统所需的工具。Celery 专注于实时任务处理,支持任务调度。说白了,它是一个分布式队列的管理工具,我们可以用 Celery 提供的接口快速实现并管理一个分布式的任务队列。1.快速入门(本文以 Celery4.0 为基
2017-12-24 14:42:57 918
转载 Pyhon基础:Monkey Patch(猴子补丁)
属性在运行时的动态替换,叫做猴子补丁(Monkey Patch)。为什么叫猴子补丁属性的运行时替换和猴子也没什么关系,关于猴子补丁的由来网上查到两种说法:1,这个词原来为Guerrilla Patch,杂牌军、游击队,说明这部分不是原装的,在英文里guerilla发音和gorllia(猩猩)相似,再后来就写了monkey(猴子)。2,还有一种解释是说由于
2017-12-24 14:41:03 620
转载 Python中datetime.timedelta的应用
当有人问你昨天是几号,是很容易就得到答案的但当要计算出100天前是几号,就不那么容易得出了而Python中datetime的timedelta则可以轻松完成计算例如:import datetime(datetime.datetime.now() - datetime.timedelta(days = 100)).strftime("%Y-%m-%d")
2017-12-24 14:31:13 1516
转载 Kombu 基础
AMQP协议:Producer产生消息,将消息赋予路由信息,发送给exchange。queue存储消息,并将消息发送Consumerbindings queues与exchange通过路由信息进行绑定。发送过来的消息带有路由信息,exchange提取路由信息和queues与exchange绑定的路由信息匹配, 匹配成功后,将
2017-12-24 14:03:28 1191
转载 SQLAlchemy 如何实现避免重复插入?(mysql中Replace的效果)
假设我有一张订单表,订单编号是唯一ID,也是主键(非自增),而我再插入新数据的时候,如果是新的订单就插入,如果遇到重复的订单编号,就更新它(订单状态更新)运用mergesession.merge(model)
2017-12-23 18:34:55 6327
转载 python中文(汉字)转拼音
1.python库pypinyin 可以使用 pip 进行安装:$ pip install pypinyineasy_install 安装:$ easy_install pypinyin源码安装:$ python setup.py installpypinyin0.28.0 文档 »pypinyin0.28.0文档:http://pypinyin.moz...
2017-12-23 16:13:35 5165
转载 Python 字典(Dictionary) setdefault()方法
描述Python 字典 setdefault() 函数和get() 方法类似, 如果键不存在于字典中,将会添加键并将值设为默认值。语法setdefault()方法语法:dict.setdefault(key, default=None)参数key -- 查找的键值。default -- 键不存在时,设置的默认键值。返回值如果字典中
2017-12-23 16:08:58 989 1
转载 python chr()、unichr()和ord()
chr()、unichr()和ord()chr()函数用一个范围在range(256)内的(就是0~255)整数作参数,返回一个对应的字符。unichr()跟它一样,只不过返回的是Unicode字符,这个从Python 2.0才加入的unichr()的参数范围依赖于你的Python是如何被编译的。如果是配置为USC2的Unicode,那么它的允许范围就是range(65536)或0x0000-
2017-12-23 15:55:58 423
转载 Python】Pandas的apply函数使用示例
apply 是 pandas 库的一个很重要的函数,多和 groupby 函数一起用,也可以直接用于 DataFrame 和 Series 对象。主要用于数据聚合运算,可以很方便的对分组进行现有的运算和自定义的运算。数据集使用的数据集是美国人口普查的数据,可以从这里下载,里面包含了CSV数据文件和PDF说明文件,说明文件里解释了每个变量的意义。数据大致是这个样子
2017-12-23 15:13:46 1572
转载 python中将汉字转换为拼音的库xpinyin
首先是pip install xpinyinIn [4]: import fakerIn [5]: from xpinyin import PinyinIn [6]: init = faker.Faker(locale='zh-cn')In [8]: pinyin = Pinyin()In [10]: for i in range(10): ...: name =
2017-12-23 12:49:38 1582
转载 Python 模拟数据生成模块 Faker
原帖地址: http://blog.csdn.net/huilan_same/article/details/77367293有时候接口或UI上传入的数据需要符合指定的格式,我们在参数化的过程中又不愿意在excel中一遍遍去构造这样的数据,这时我们可以加入生成器来为我们产生符合某些固定格式的数据。 这里我推荐一个挺有意思的库,Faker,能够为你产生各种假数据别
2017-12-23 12:07:23 1732
转载 Python中__repr__和__str__区别
看下面的例子就明白了class Test(object): def __init__(self, value='hello, world!'): self.data = value>>> t = Test()>>> t0x7fa91c307190>>>> print t0x7fa91c307190># 看到了么?上面打印类对象并不是很友好,显示的是对象的
2017-12-21 22:31:02 237
转载 Python的namedtuple使用详解
namedtuple是继承自tuple的子类。namedtuple创建一个和tuple类似的对象,而且对象拥有可访问的属性。下面看个列子from collections import namedtuple# 定义一个namedtuple类型User,并包含name,sex和age属性。User = namedtuple('User', ['name', 'sex', 'age']
2017-12-20 10:01:04 270
转载 Python高级编程技巧
译注:本文的英文题目是《Advanced Design Patterns in Python》,可直译为《Python中的高级设计模式》。不过本人在通读完全文之后发现文章的内容与我们通常理解的设计模式有很大出入,原文后的评论中也有其他读者提出了这一点。因此,根据文章内容我将题目译为“Python高级编程技巧”,如有不同意见请留言指出,非常感谢。正文:本文展示一些高级的Pytho
2017-12-19 22:24:29 279
转载 Python的30个编程技巧
1. 原地交换两个数字Python 提供了一个直观的在一行代码中赋值与交换(变量值)的方法,请参见下面的示例:x,y= 10,20print(x,y)x,y= y,xprint(x,y)#1 (10, 20)#2 (20, 10)赋值的右侧形成了一个新的元组,左侧立即解析(unpack)那个(未被引用的)元组到变量 和 。
2017-12-18 23:34:32 468
转载 np.dot函数
dot函数是np中的矩阵乘法,x.dot(y) 等价于 np.dot(x,y)x是m*n 矩阵 ,y是n*m矩阵则x.dot(y) 得到m*m矩阵 矩阵乘法的应用实例如下: 数据统计某公司有四个工厂,分布在不同地区,同时三种产品,产量(单位;t),试用矩阵统计这些数据。工厂\产品P1P2
2017-12-17 19:07:07 2022
转载 numpy常用函数之randn
numpy中有一些常用的用来产生随机数的函数,randn就是其中一个,randn函数位于numpy.random中,函数原型如下:numpy.random.randn(d0, d1, ..., dn)这个函数的作用就是从标准正态分布中返回一个或多个样本值。什么是标准正态分布,大哥,你别吓我,上过高中吗?标准正态分布俗称高斯分布,正态分布是大自然中最常见的分布,标准正态分布就是期望为0,
2017-12-17 18:31:10 1135
转载 Pandas_数据重构stack
import numpy as npimport pandas as pd12stack将行索引旋转为列索引,完成层级索引。下面例子中,先创建一盒5 × 2 的DataFrame。然后对它进行stack,于是原来的行索引变成了外层索引,原来的列索引变成了内层索引了。df_obj = pd.DataFrame(np.random.randint(0,10, (5
2017-12-17 16:34:48 604
原创 numpy.random.randint() 简介
ow、high、size三个参数。默认high是None,如果只有low,那范围就是[0,low)。如果有high,范围就是[low,high)。>>> np.random.randint(2, size=10)array([1, 0, 0, 0, 1, 1, 0, 0, 1, 0])>>> np.random.randint(1, size=10)array([0, 0, 0
2017-12-17 16:26:44 4729
转载 Pandas透视表(pivot_table)详解
介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语法。所以,本文将重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。如果你对这个概念不熟悉,wikipedia上对它做了详细的解
2017-12-17 16:06:54 2668 1
转载 numpy.linspace使用详解
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)在指定的间隔内返回均匀间隔的数字。返回num均匀分布的样本,在[start, stop]。这个区间的端点可以任意的被排除在外。Parameters(参数):start :
2017-12-17 15:41:52 817
Android Power On Off
2012-07-08
homeswitcher
2012-06-20
HeadFirstDesignPatterns_code
2012-06-17
android设置主题和自定义主题的方法
2012-04-20
Android实例2
2012-03-27
Android实例
2012-03-27
Android 9patch失效
2012-02-22
google_sdk_android3
2012-02-02
Google_android_java
2012-02-02
格式工厂-支持几乎所有类型多媒体格式到常用的几种格式
2012-01-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人