![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据处理
文章平均质量分 71
zzpdbk
这个作者很懒,什么都没留下…
展开
-
pandas的连接函数concat()函数
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)参数含义objs:Series,DataFrame或Pa...翻译 2018-02-01 20:18:35 · 165284 阅读 · 7 评论 -
pandas的离散化,面元划分
pd.cutpandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)x:要分箱的输入数组。它必须是一维的。bin:int或标量序列如果bins是一个int,它定义在x范围内的等宽单元的数量。然而,在这种情况下,x原创 2018-02-02 00:31:09 · 1365 阅读 · 0 评论 -
pandas重索引和改变标签
.reindexindex:array-like,可选(可以按顺序指定或as关键字)新标签/索引符合。优选地,Index对象用于避免重复数据fill_value:scalar,default np.NaN缺失值使用的值。默认为NaN,但可以是任何“兼容”值In [178]: s = pd.Series(np.random.randn(5),原创 2018-02-02 15:43:27 · 4778 阅读 · 0 评论 -
numpy的where
numpy.where(condition[, x, y])根据条件,从x或y返回元素。如果只给出条件,则返回condition.nonzero()。参数:condition:array_like,bool当为True时,产量x,否则产生y。x,y:array_like,可选要选择的值。x和y需要具有与条件相同的形状。原创 2018-02-03 01:06:55 · 352 阅读 · 0 评论 -
pandas 数据筛选
不断更新,包含我在实际使用的例子loc and iloc. 这两个方法能通过axis labels(loc)或integer(iloc),来选择行或列。data = pd.DataFrame(np.arange(12).reshape((3,4)),columns = ['one','two','three','four'],index = ['CZ','RP','HS'])In原创 2018-02-06 16:28:09 · 466 阅读 · 0 评论 -
pandas 的 map, applymap and apply
一、Series.map(arg, na_action=None) arg:function,dict或Series na_action:{None,'ignore'}如果’ignore’,传播NA值,而不将它们传递到映射函数s = pd.Series([1, 2, 3, np.nan])s2 = s.map(lambda x: 'this is a string原创 2018-02-06 22:29:04 · 1496 阅读 · 0 评论 -
pandas处理缺失值
pandas 用 nan 表示缺失值,可以用 isnull() 检测In [1]: import pandas as pdIn [2]: import numpy as npIn [3]: string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado'])In [4]: string_dataOut[4]:原创 2018-02-07 14:30:07 · 5263 阅读 · 0 评论