pands
梦寐_
这个作者很懒,什么都没留下…
展开
-
pandas:axis=0 axis=1的理解
轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。官方对于0和1的解释是轴,也就是坐标轴。而坐标轴是有方向的,所以千万不要用行和列的思维去想axis,因为行和列是没有方向的,这样想会在遇到不同的例子时感到困惑。根据官方的说法,1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,而体现出来的是列的增加或...转载 2019-09-27 20:06:42 · 609 阅读 · 0 评论 -
pandas:时间序列—date_range函数
函数原型pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)start:string或datetime-like,默认值是None,表示日期的起点。end:string或datetime-li...转载 2019-09-27 13:54:36 · 282 阅读 · 0 评论 -
pandas:read_excel()和to_excel函数解析
read_excel()加载函数为read_excel(),其具体参数如下。read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None,names=None, parse_cols=None, parse_dates=False,date_parser=None,na_values=Non...原创 2019-09-29 20:58:13 · 2235 阅读 · 0 评论 -
pandas:去重函数 pandas.DataFrame.drop_duplicates
- 1、官方文档:df.drop_duplicates?Signature: df.drop_duplicates(subset=None, keep='first', inplace=False)Docstring:Return DataFrame with duplicate rows removed, optionally onlyconsidering certain colum...原创 2019-10-30 16:21:54 · 859 阅读 · 0 评论 -
Python pandas.read_csv()和to_csv函数解析
pandas.read_csv函数pandas.read_csv(filepath_or_buffer, sep=', ', usecols=None, engine=None, header='infer', skiprows=None, nrows=None, skipfooter=0)filepath_or_buffer:可以是一个URL或者本地文件。有效的U...原创 2019-10-29 20:28:53 · 1733 阅读 · 0 评论 -
pandas:数据结构Series,DataFrame,reindex函数
pandas概述pandas :pannel data analysis(面板数据分析)。pandas是基于numpy构建的,为时间序列分析提供了很好的支持。pandas中有两个主要的数据结构,一个是Series,另一个是DataFrame。数据结构 SeriesSeries 类似于一维数组与字典(map)数据结构的结合。它由一组数据和一组与数据相对应的数据标签(索引index)组成。这组数...原创 2019-09-25 22:16:15 · 588 阅读 · 0 评论 -
pandas:Index对象
IndexIndex对象保存着索引标签数据,它可以快速找到标签对应的整数下标,其功能与Python的字典类似。dict1={"Province":["Guangdong","Beijing","Qinghai","Fujiang"], "year":[2018]*4, "pop":[1.3,2.5,1.1,0.7]}df1=DataFrame(dict1)print...原创 2019-09-28 15:30:56 · 143 阅读 · 0 评论 -
pandas:排序和排名
有的时候我们可以要根据索引的大小或者值的大小对Series和DataFrame进行排名和排序。一、排序pandas提供了sort_index方法可以根据行或列的索引按照字典的顺序进行排序,返回一个已排 的新对象a、Series排序1、按索引进行排序 #定义一个Series s = Series([1,2,3],index=["a","c","b"]) #对Serie...原创 2019-09-27 13:40:42 · 458 阅读 · 0 评论 -
pands:通过其name属性获取/设置索引
data={'time':data_s, 'weight':weight}ss=pd.DataFrame(data)ss.index.name='huhu'原创 2019-09-27 14:16:59 · 209 阅读 · 0 评论 -
pandas:根据条件获取元素所在的位置(索引).index.tolist()
在dataframe中根据一定的条件,得到符合要求的某行元素所在的位置。df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50])print(df)a = df[(df.BoolCol==3)&(df.attr==22)].ind...转载 2019-09-27 13:09:54 · 13729 阅读 · 0 评论 -
pandas:DataFrame对行和列的操作.head()、.tail()
import numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))data['w'...转载 2019-09-27 13:39:33 · 13869 阅读 · 0 评论 -
pandas:ix 、loc 、 iloc区别、.at、.iat和.get_value
1 loc——通过行标签索引行数据1.loc[1]表示索引的是第1行(index 是整数)data = [[1,2,3],[4,5,6]]index = [0,1]columns=['a','b','c']df = pd.DataFrame(data=data, index=index, columns=columns)print (df.loc[1])'''a 4b ...转载 2019-09-27 23:07:33 · 7177 阅读 · 0 评论 -
pands:numpy函数应用与映射
numpy函数应用与映射from pandas import Indexfrom pandas import Series,DataFrameimport numpy as npimport pandas as pd#numpy函数在Series/DataFrame的应用frame=DataFrame(np.arange(9).reshape(3,3), ...原创 2019-09-26 09:28:52 · 521 阅读 · 0 评论 -
pandas:算术运算,数据对齐
算术运算和数据对齐from pandas import Indexfrom pandas import Series,DataFrameimport numpy as npimport pandas as pd#DataFrame算术:不重叠部分为NaN,重叠部分元素运算'x=DataFrame(np.arange(9).reshape(3,3), ...原创 2019-09-25 23:20:15 · 701 阅读 · 0 评论 -
pandas:重新指定索引reindex函数,删除行/列drop函数,索引、选取和过滤
基本功能对列/行索引重新指定索引(删除/增加:行/列):reindex函数reindex的method选项:#重新指定索引及NaN填充值x= Series([4,7,5],index= ['a','b','c'])y= x.reindex(['a','b','c','d'])print(y)"""a 4.0b 7.0c 5.0d NaNdtype:...原创 2019-09-25 22:59:05 · 7904 阅读 · 0 评论 -
pandas:描述和汇总统计
pandas提供了很多常用的数学和统计方法,其中大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。mean()平均值 median()中位数 max()最大值 min()最小值 sum()求和 std()标准差Series类型独有的方法: argmax()最大值的位置 argmin()最...原创 2019-09-27 20:45:11 · 343 阅读 · 0 评论 -
pandas:唯一值unique( ),计数值value_counts( )及成员资格isin( )
唯一值obj=pd.Series(['c','a','d','a','a','b','b','c','c','c'])print(obj)'''0 c1 a2 d3 a4 a5 b6 b7 c8 c9 cdtype: object'''print(obj.unique())#['c' 'a' 'd' '...原创 2019-09-27 20:50:42 · 1132 阅读 · 0 评论 -
pandas:处理缺失值——缺失值的判断、缺失值填充
在实际应用中对于数据进行分析的时候,经常能看见缺失值,下面来介绍一下如何利用pandas来处理缺失值。常见的缺失值处理方式有,过滤、填充。缺失值的判断pandas使用浮点值NaN(Not a Number)表示浮点数和非浮点数组中的缺失值,同时python内置None值也会被当作是缺失值。DataFrame.dropna(axis=0, how='any', thresh=None, su...原创 2019-09-27 21:34:45 · 14305 阅读 · 0 评论 -
pandas:层次化索引
层次化索引(hierarchical indexing)是pandas的一个重要的功能,它可以在一个轴上有多个(两个以上)的索引,这就表示着,它能够以低维度形式来表示高维度的数据。一. 创建多层行索引1、 隐式构造1)最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组,Series也可以创建多层索引。s = Series(np.random.randint(0,...转载 2019-09-27 22:40:00 · 2395 阅读 · 0 评论 -
pandas:展示数据输出时列名不能对齐
用pandas展示数据输出时列名不能对齐列名用了中文的缘故,设置pandas的参数即可,代码如下: import pandas as pd #这两个参数的默认设置都是False pd.set_option('display.unicode.ambiguous_as_wide', True) pd.set_option('display.unicode.east_asian...原创 2019-09-28 09:40:23 · 2027 阅读 · 1 评论 -
pandas:MultiIndex对象
分层/多级索引非常令人兴奋,因为它为一些非常复杂的数据分析和操作提供了可能性,特别是对于处理更高维度的数据。从本质上讲,它使你能在较低维度的数据结构(如Series(1d)和DataFrame(2d))中存储和操作具有任意数量维度的数据。创建MultiIndexMultiIndex对象是标准Index对象的扩展, 你可以将MultiIndex视为元组构成的列表,其中每个元组都是唯一的, 它与I...转载 2019-09-28 10:48:26 · 1351 阅读 · 0 评论 -
pandas:分组(GroupBy)
andas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其他...原创 2019-09-29 00:30:26 · 2959 阅读 · 1 评论 -
pands:数据合并与重塑——concat、merge、join
pandas数据的行更新、表合并等操作,一般用到的方法有concat、join、merge。1 concatconcat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None...原创 2019-10-08 14:20:11 · 664 阅读 · 0 评论 -
Pandas:标记删除重复记录
Pandas提供了duplicated、Index.duplicated、drop_duplicates函数来标记及删除重复记录duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复,重复为True,不重复为Falsepandas.DataFrame.duplicated(self, subset=None, keep='first')pandas.Ser...原创 2019-10-08 16:06:10 · 263 阅读 · 0 评论