pythonisalpha函数_Pandas V0.23.1函数手册(中文翻译版)

本文档详尽地介绍了Pandas Index对象的各种属性、方法和功能,包括单调性检查、唯一性验证、数据类型转换、操作及计算,以及如何在索引上执行常见操作,如复制、删除、重复值处理等。此外,还涵盖了不同类型的Index,如DatetimeIndex、MultiIndex等,以及它们的特性和用法。
摘要由CSDN通过智能技术生成

在包含索引(Series/DataFrame)的对象上可以获得这些方法或其变体中的许多,这些方法或变体最有可能在直接调用这些方法之前使用。

Index

不可变的ndarray实现有序的、可切片的集合。

属性

Index.values

以ndarray形式返回基础数据

Index.is_monotonic

别名为is _ monotical _ exporting (已弃用)

Index.is_monotonic_increasing

如果索引是单调递增(仅相等或递增)值,则返回。

Index.is_monotonic_decreasing

如果索引是单调递减(仅相等或递减)值,则返回。

Index.is_unique

如果索引具有唯一值,则返回

Index.has_duplicates

-

Index.hasnans

如果我有南社就回来;启用各种性能加速

Index.dtype

返回基础数据的dtype对象

Index.dtype_str

返回基础数据的dtype字符串

Index.inferred_type

返回从值推断的类型的字符串

Index.is_all_dates

-

Index.shape

返回基础数据形状的元组

Index.name

-

Index.names

-

Index.nbytes

返回基础数据中的字节数

Index.ndim

根据定义1返回基础数据的维数

Index.size

返回基础数据中的元素数

Index.empty

-

Index.strides

返回基础数据的步长

Index.itemsize

返回基础数据项的dtype大小

Index.base

如果共享基础数据的内存,则返回基对象

Index.T

返回转置,这是自我定义

Index.memory_usage([deep])

值的内存使用

修改和计算

Index.all(*args, **kwargs)

返回所有元素是否为真。

Index.any(*args, **kwargs)

返回任何元素是否为真。

Index.argmin([axis])

返回最小参数索引器的ndarray

Index.argmax([axis])

返回最大参数索引器的ndarray

Index.copy([name, deep, dtype])

复制此对象。

Index.delete(loc)

删除传递位置为( - s )的新索引

Index.drop(labels[, errors])

创建新索引,删除传递的标签列表

Index.drop_duplicates([keep])

返回删除重复值的索引。

Index.duplicated([keep])

指示重复的索引值。

Index.equals(other)

确定两个索引对象是否包含相同的元素。

Index.factorize([sort, na_sentinel])

将对象编码为枚举类型或分类变量。

Index.identical(other)

类似于equals,但检查其他类似属性是否也相同

Index.insert(loc, item)

制作新索引在位置插入新项目。

Index.is_(other)

更灵活、更快速的检查就像是,但这可以通过视图来实现

Index.is_boolean()

-

Index.is_categorical()

检查索引是否包含分类数据。

Index.is_floating()

-

Index.is_integer()

-

Index.is_interval()

-

Index.is_lexsorted_for_tuple(tup)

-

Index.is_mixed()

-

Index.is_numeric()

-

Index.is_object()

-

Index.min()

返回索引的最小值。

Index.max()

返回索引的最大值。

Index.reindex(target[, method, level, …])

使用目标值创建索引(根据需要移动/添加/删除值)

Index.rename(name[, inplace])

在索引上设置新名称。

Index.repeat(repeats, *args, **kwargs)

重复索引的元素。

Index.where(cond[, other])

-

Index.take(indices[, axis, allow_fill, …])

返回索引所选值的新索引

Index.putmask(mask, value)

返回使用掩码设置的值的新索引

Index.set_names(names[, level, inplace])

在索引上设置新名称。

Index.unique([level])

返回索引中的唯一值。

Index.nunique([dropna])

返回对象中唯一元素的数目。

Index.value_counts([normalize, sort, …])

返回包含唯一值计数的对象。

缺失值

Index.fillna([value, downcast])

用指定值填充NA / NaN值

Index.dropna([how])

没有NA / NaN值的返回索引

Index.isna()

检测缺失值。

Index.notna()

检测现有(未丢失)值。

转变

Index.astype(dtype[, copy])

创建具有转换为dtypes的值的索引。

Index.item()

以python标量形式返回基础数据的第一个元素

Index.map(mapper[, na_action])

使用输入对应关系映射值( dict、Series或函数)。

Index.ravel([order])

返回基础数据的展平值的数组

Index.tolist()

返回值列表。

Index.to_native_types([slicer])

格式化self的指定值并返回它们。

Index.to_series([index, name])

创建一个索引和值都等于索引键的Series,该索引键与map一起用于基于索引返回索引器

Index.to_frame([index])

使用包含索引的列创建DataFrame。

Index.view([cls])

-

整理

Index.argsort(*args, **kwargs)

返回对索引进行排序的整数标记。

Index.searchsorted(value[, side, sorter])

查找应该插入元素以维持秩序的索引。

Index.sort_values([return_indexer, ascending])

返回索引的排序副本。

特定时间操作

Index.shift([periods, freq])

按所需的时间频率增量数移位索引。

组合/连接/设置操作

Index.append(other)

将索引选项集合附加在一起

Index.join(other[, how, level, …])

这是一种内部非公开的方法

Index.intersection(other)

形成两个索引对象的交集。

Index.union(other)

形成两个索引对象的并集,并尽可能进行排序。

Index.difference(other)

返回一个新索引,其中包含索引中不在其他位置的元素。

Index.symmetric_difference(other[, result_name])

计算两个索引对象的对称差。

选择

Index.asof(label)

对于排序的索引,返回直到并包括传递的标签的最新标签。

Index.asof_locs(where, mask)

其中:时间戳掩码数组:数据不是NA的布尔数组

Index.contains(key)

如果此键在索引中,则返回布尔值

Index.get_duplicates()

(已弃用)提取重复的索引元素。

Index.get_indexer(target[, method, limit, …])

计算给定当前索引的新索引的索引器和掩码。

Index.get_indexer_for(target, **kwargs)

即使在不唯一的情况下,也保证返回索引器,这将根据需要分派给get _ indexer或get _ indexer _ uninique

Index.get_indexer_non_unique(target)

计算给定当前索引的新索引的索引器和掩码。

Index.get_level_values(level)

返回请求级别的值索引,等于索引的长度。

Index.get_loc(key[, method, tolerance])

获取请求标签整数位置,切片或布尔掩码。

Index.get_slice_bound(label, side, kind)

计算与给定标签相对应的切片边界。

Index.get_value(series, key)

从一维数组快速查找值。

Index.get_values()

以数字形式返回索引数据

Index.set_value(arr, key, value)

从一维数组快速查找值。

Index.isin(values[, level])

返回索引值以值为单位的布尔数组。

Index.slice_indexer([start, end, step, kind])

对于有序或唯一索引,计算输入标签和步骤的切片索引器。

Index.slice_locs([start, end, step, kind])

计算输入标签的切片位置。

数字索引

RangeIndex

实现单调整数范围的不可变索引。

Int64Index

不可变的ndarray实现有序的、可切片的集合。

UInt64Index

不可变的ndarray实现有序的、可切片的集合。

Float64Index

不可变的ndarray实现有序的、可切片的集合。

RangeIndex.from_range(data[, name, dtype])

从范围( py3 )或xrange ( py2 )对象创建范围索引

范畴尺度指数

CategoricalIndex

实现有序、可切片集合的不可变索引。

范畴成分

CategoricalIndex.codes

-

CategoricalIndex.categories

-

CategoricalIndex.ordered

-

CategoricalIndex.rename_categories(*args, …)

重命名类别。

CategoricalIndex.reorder_categories(*args, …)

按照new _ categories中的指定重新排序类别。

CategoricalIndex.add_categories(*args, **kwargs)

添加新类别。

CategoricalIndex.remove_categories(*args, …)

删除指定的类别。

CategoricalIndex.remove_unused_categories(…)

删除未使用的类别。

CategoricalIndex.set_categories(*args, **kwargs)

将类别设置为指定的new _ categories。

CategoricalIndex.as_ordered(*args, **kwargs)

设置要排序的分类

CategoricalIndex.as_unordered(*args, **kwargs)

将分类设置为无序

CategoricalIndex.map(mapper)

使用输入对应关系映射值( dict、Series或函数)。

internalindex

IntervalIndex

实现有序、可切片集合的不可变索引。

internalindex组件

IntervalIndex.from_arrays(left, right[, …])

由定义左右边界的两个数组构造。

IntervalIndex.from_tuples(data[, closed, …])

从元组列表/数组中构建internalindex

IntervalIndex.from_breaks(breaks[, closed, …])

从拆分数组构造internalindex

IntervalIndex.contains(key)

返回一个布尔值,指示键是否在索引中

IntervalIndex.left

返回internalindex中每个间隔的左端点作为索引

IntervalIndex.right

返回internalindex中每个间隔的右端点作为索引

IntervalIndex.mid

返回internalindex中每个间隔的中点作为索引

IntervalIndex.closed

间隔是在左侧、右侧关闭,还是两者都关闭

IntervalIndex.length

返回一个索引,其中的条目表示internalindex中每个间隔的长度

IntervalIndex.values

将internalindex的数据作为间隔对象的numpy数组返回( dtype = ' object ' )

IntervalIndex.is_non_overlapping_monotonic

如果internalindex不重叠(无间隔共享点),并且单调递增或单调递减,则返回True,否则返回False

IntervalIndex.get_loc(key[, method])

获取请求标签整数位置,切片或布尔掩码。

IntervalIndex.get_indexer(target[, method, …])

计算给定当前索引的新索引的索引器和掩码。

多指标

MultiIndex

Pandas对象的多级或分层索引对象

IndexSlice

创建对象以更轻松地执行多索引切片

多指标构造函数

MultiIndex.from_arrays(arrays[, sortorder, …])

将数组转换为多索引

MultiIndex.from_tuples(tuples[, sortorder, …])

将元组列表转换为多索引

MultiIndex.from_product(iterables[, …])

由多个可滴定物的笛卡儿积建立多指标

多指标属性

MultiIndex.names

多重索引中的层级名称

MultiIndex.levels

-

MultiIndex.labels

-

MultiIndex.nlevels

此多重索引中的整数层级。

MultiIndex.levshape

具有每个级别长度的元组。

多指标成分

MultiIndex.set_levels(levels[, level, …])

在多索引上设置新级别。

MultiIndex.set_labels(labels[, level, …])

在多索引上设置新标签。

MultiIndex.to_hierarchical(n_repeat[, n_shuffle])

返回重新整形的多索引,以符合n _ repeat和n _ shuffle给定的形状。

MultiIndex.to_frame([index])

以多索引级别为列创建DataFrame。

MultiIndex.is_lexsorted()

如果标签按字典顺序排序,则返回True

MultiIndex.sortlevel([level, ascending, …])

在请求的级别排序多索引。

MultiIndex.droplevel([level])

移除要求层级的传回索引。

MultiIndex.swaplevel([i, j])

用j级交换一级

MultiIndex.reorder_levels(order)

使用输入顺序重新排列级别。

MultiIndex.remove_unused_levels()

从当前创建一个新的多索引,以删除未使用的级别,这意味着它们不会在标签中表达

MultiIndex.unique([level])

返回索引中的唯一值。

多指标选择

MultiIndex.get_loc(key[, method])

获取作为整数、切片或布尔掩码的标签或标签元组的位置。

MultiIndex.get_indexer(target[, method, …])

计算给定当前索引的新索引的索引器和掩码。

MultiIndex.get_level_values(level)

返回请求级别的标签值向量,等于索引的长度。

日期时间索引

DatetimeIndex

datetime64数据的不可变的ndarray,内部表示为int 64,它可以被装箱到作为datetime子类的时间戳对象中,并携带诸如频率信息之类的元数据。

时间/日期组成部分

DatetimeIndex.year

日期时间的年份

DatetimeIndex.month

1月= 1月,12月= 12月

DatetimeIndex.day

日期时间的天数

DatetimeIndex.hour

日期时间的小时数

DatetimeIndex.minute

日期时间的分钟数

DatetimeIndex.second

日期时间的秒数

DatetimeIndex.microsecond

日期时间的微秒

DatetimeIndex.nanosecond

日期时间的纳秒

DatetimeIndex.date

返回python datetime . date对象的numpy数组(即时间戳中没有时区信息的日期部分)。

DatetimeIndex.time

返回datetime . time的numpy数组。

DatetimeIndex.dayofyear

一年中的第几天

DatetimeIndex.weekofyear

一年中的第几周

DatetimeIndex.week

一年中的第几周

DatetimeIndex.dayofweek

星期一= 0,星期日= 6的星期几

DatetimeIndex.weekday

星期一= 0,星期日= 6的星期几

DatetimeIndex.quarter

日期的季度

DatetimeIndex.tz

-

DatetimeIndex.freq

如果设置了frequency对象,则返回该对象,否则无

DatetimeIndex.freqstr

如果设置了frequency对象,则将其作为字符串返回,否则无

DatetimeIndex.is_month_start

逻辑指示每月第一天(由频率定义)

DatetimeIndex.is_month_end

指示日期是否为当月的最后一天。

DatetimeIndex.is_quarter_start

指示日期是否为季度的第一天。

DatetimeIndex.is_quarter_end

指示日期是否为季度的最后一天。

DatetimeIndex.is_year_start

指出日期是否为一年中的第一天。

DatetimeIndex.is_year_end

指出日期是否为一年中的最后一天。

DatetimeIndex.is_leap_year

如果日期属于闰年,则为布尔指示符。

DatetimeIndex.inferred_freq

尝试返回一个string类型的值,该值代表由inversion _ freq生成的频率猜测。

选择

DatetimeIndex.indexer_at_time(time[, asof])

返回索引值在一天中特定时间的索引位置(例如

DatetimeIndex.indexer_between_time(…[, …])

返回一天中特定时间(例如9 : 00 - 9 : 30 )之间的值的索引位置。

特定时间操作

DatetimeIndex.normalize()

将时间转换为午夜。

DatetimeIndex.strftime(date_format)

使用指定的date _ format转换为索引。

DatetimeIndex.snap([freq])

将时间戳捕捉到最近出现的频率

DatetimeIndex.tz_convert(tz)

将tz感知的日期时间索引从一个时区转换到另一个时区。

DatetimeIndex.tz_localize(tz[, ambiguous, …])

将tz - naive日期时间索引本地化为tz感知的日期时间索引。

DatetimeIndex.round(freq, *args, **kwargs)

将数据舍入到指定的频率。

DatetimeIndex.floor(freq)

将数据降至指定频率。

DatetimeIndex.ceil(freq)

将数据上限设置为指定频率。

DatetimeIndex.month_name([locale])

返回具有指定区域设置的DateTimeIndex的月份名称。

DatetimeIndex.day_name([locale])

返回具有指定区域设置的DateTimeIndex的日期名称。

转变

DatetimeIndex.to_period([freq])

以特定频率转换为周期指数。

DatetimeIndex.to_perioddelta(freq)

计算指标值与按指定频率转换为周期指标的指标之间差值的时间增量指标。

DatetimeIndex.to_pydatetime()

返回DatetimeIndex作为datetime . datetime对象的对象数组

DatetimeIndex.to_series([keep_tz, index, name])

创建一个索引和值都等于索引键的Series,该索引键与map一起用于基于索引返回索引器

DatetimeIndex.to_frame([index])

使用包含索引的列创建DataFrame。

时间增量指数

TimedeltaIndex

timedelta 64数据的不可变数组,内部表示为int 64,可以装箱到timedelta对象中

成分

TimedeltaIndex.days

每个元素的天数。

TimedeltaIndex.seconds

每个元素的秒数( > = 0且小于1天)。

TimedeltaIndex.microseconds

每个元素的微秒数( > = 0且小于1秒)。

TimedeltaIndex.nanoseconds

每个元素的纳秒数( > = 0且小于1微秒)。

TimedeltaIndex.components

返回时间增量组件的DataFrame(天、小时、分钟、秒、毫秒、微秒、纳秒)。

TimedeltaIndex.inferred_freq

尝试返回一个string类型的值,该值代表由inversion _ freq生成的频率猜测。

转变

TimedeltaIndex.to_pytimedelta()

将timedeltindex作为datetimedelta对象的对象数组返回

TimedeltaIndex.to_series([index, name])

创建一个索引和值都等于索引键的Series,该索引键与map一起用于基于索引返回索引器

TimedeltaIndex.round(freq, *args, **kwargs)

将数据舍入到指定的频率。

TimedeltaIndex.floor(freq)

将数据降至指定频率。

TimedeltaIndex.ceil(freq)

将数据上限设置为指定频率。

TimedeltaIndex.to_frame([index])

使用包含索引的列创建DataFrame。

周期指数

PeriodIndex

毫无疑问,ndarray holding ordinal values indirect regular periods of such as a special years,quarters,months,等等,这些都是在这些年份中经常出现的情况。

属性

PeriodIndex.day

期间的天数

PeriodIndex.dayofweek

星期一= 0,星期日= 6的星期几

PeriodIndex.dayofyear

一年中的第几天

PeriodIndex.days_in_month

当月的天数

PeriodIndex.daysinmonth

当月的天数

PeriodIndex.end_time

-

PeriodIndex.freq

如果设置了frequency对象,则返回该对象,否则无

PeriodIndex.freqstr

如果设置了frequency对象,则将其作为字符串返回,否则无

PeriodIndex.hour

时段的时间

PeriodIndex.is_leap_year

逻辑指示日期是否属于闰年

PeriodIndex.minute

时段的分钟

PeriodIndex.month

1月= 1月,12月= 12月

PeriodIndex.quarter

日期的季度

PeriodIndex.qyear

-

PeriodIndex.second

第二阶段

PeriodIndex.start_time

-

PeriodIndex.week

一年中的第几周

PeriodIndex.weekday

星期一= 0,星期日= 6的星期几

PeriodIndex.weekofyear

一年中的第几周

PeriodIndex.year

期间的年份

方法

PeriodIndex.asfreq([freq, how])

将周期指数转换为指定的频率频率。

PeriodIndex.strftime(date_format)

使用指定的date _ format转换为索引。

PeriodIndex.to_timestamp([freq, how])

转换为日期时间索引

PeriodIndex.tz_convert(tz)

将tz感知的日期时间索引从一个时区转换到另一个时区(使用pytz / dateutil )

PeriodIndex.tz_localize(tz[, ambiguous])

将tz - naive datetimendix本地化为给定时区(使用pytz / dateutil ),或从tz感知的datetimendix中删除时区

标量

时期

Period

代表一段时间

属性

Period.day

获取某个时间段所在月份的日期。

Period.dayofweek

返回星期几。

Period.dayofyear

返回一年中的某一天。

Period.days_in_month

获取此期间所在月份的总天数。

Period.daysinmonth

获取期间所在月份的总天数。

Period.end_time

-

Period.freq

-

Period.freqstr

-

Period.hour

获取时间段中的一天中的小时数。

Period.is_leap_year

-

Period.minute

获取时间段的小时组成部分的分钟数。

Period.month

-

Period.ordinal

-

Period.quarter

-

Period.qyear

-

Period.second

获取周期的第二部分。

Period.start_time

获取周期开始的时间戳。

Period.week

获取给定时间段内的一年中的一周。

Period.weekday

-

Period.weekofyear

-

Period.year

-

方法

Period.asfreq

在间隔开始或结束时,将周期转换为所需频率

Period.now

-

Period.strftime

根据选定的fmt返回周期的字符串表示形式。

Period.to_timestamp

返回指定周期结束(方式)时目标频率上周期的时间戳表示

时间戳

Timestamp

Pandas替换日期时间

性能

Timestamp.asm8

-

Timestamp.day

-

Timestamp.dayofweek

-

Timestamp.dayofyear

-

Timestamp.days_in_month

-

Timestamp.daysinmonth

-

Timestamp.fold

-

Timestamp.hour

-

Timestamp.is_leap_year

-

Timestamp.is_month_end

-

Timestamp.is_month_start

-

Timestamp.is_quarter_end

-

Timestamp.is_quarter_start

-

Timestamp.is_year_end

-

Timestamp.is_year_start

-

Timestamp.max

-

Timestamp.microsecond

-

Timestamp.min

-

Timestamp.minute

-

Timestamp.month

-

Timestamp.nanosecond

-

Timestamp.quarter

-

Timestamp.resolution

-

Timestamp.second

-

Timestamp.tz

tzinfo的别名

Timestamp.tzinfo

-

Timestamp.value

-

Timestamp.week

-

Timestamp.weekofyear

-

Timestamp.year

-

方法

Timestamp.astimezone

将tz感知时间戳转换为另一个时区。

Timestamp.ceil

返回导致此解决方案的新时间戳

Timestamp.combine(date, time)

日期、时间- >日期时间,具有相同的日期和时间字段

Timestamp.ctime

返回ctime ( )样式字符串。

Timestamp.date

返回年、月、日相同日期对象。

Timestamp.day_name

返回具有指定区域设置的时间戳的日期名称。

Timestamp.dst

返回自我。

Timestamp.floor

返回此分辨率下的新时间戳

Timestamp.freq

-

Timestamp.freqstr

-

Timestamp.fromordinal(ordinal[, freq, tz])

传递序号,翻译并转换为ts注释:根据定义,序号本身不能有任何tz信息

Timestamp.fromtimestamp(ts)

时间戳[,tz ] - >从POSIX时间戳开始的tz本地时间。

Timestamp.isocalendar

返回包含ISO年、周数和工作日的三元组。

Timestamp.isoformat

-

Timestamp.isoweekday

返回日期所代表的星期几。

Timestamp.month_name

返回具有指定区域设置的时间戳的月份名称。

Timestamp.normalize

将时间戳标准化到午夜,保留tz信息。

Timestamp.now([tz])

返回表示tz本地当前时间的新时间戳对象。

Timestamp.replace

实现日期时间。替换,处理纳秒

Timestamp.round

将时间戳舍入到指定的分辨率

Timestamp.strftime

格式- > strftime ( )样式字符串。

Timestamp.strptime

string,format - - >从字符串解析的新日期时间(如time . strptime ( ) )。

Timestamp.time

返回时间相同但tzinfo =无的时间对象。

Timestamp.timestamp

以浮点形式返回POSIX时间戳。

Timestamp.timetuple

返回时间元组,与时间兼容。localtime ( )。

Timestamp.timetz

返回具有相同时间和tzinfo的时间对象。

Timestamp.to_datetime64

返回一个精度为“ns”的numpy . datetime64对象

Timestamp.to_julian_date

将时间戳转换为儒略日。

Timestamp.to_period

返回此时间戳为观察值的时间段。

Timestamp.to_pydatetime

将时间戳对象转换为本机Python datetime对象。

Timestamp.today(cls[, tz])

返回本地时区中的当前时间。

Timestamp.toordinal

返回无理期公历序数。

Timestamp.tz_convert

将tz感知时间戳转换为另一个时区。

Timestamp.tz_localize

将原始时间戳转换为本地时区,或从tz感知时间戳中删除时区。

Timestamp.tzname

返回自我。

Timestamp.utcfromtimestamp(ts)

从POSIX时间戳构造一个幼稚的UTC日期时间。

Timestamp.utcnow()

返回表示UTC日期和时间的新时间戳。

Timestamp.utcoffset

返回self . tzinfo . utcoffset (自我)。

Timestamp.utctimetuple

返回UTC时间元组,与时间兼容。localtime ( )。

Timestamp.weekday

返回日期所代表的星期几。

间隔

Interval

实现一个区间的不可变对象,一个有界的切片状区间。

性能

Interval.closed

间隔是在左侧、右侧关闭,还是两者都关闭

Interval.closed_left

检查左侧间隔是否关闭。

Interval.closed_right

检查右侧间隔是否关闭。

Interval.left

左界间隔

Interval.length

返回间隔的长度

Interval.mid

返回间隔的中点

Interval.open_left

检查左侧间隔是否打开。

Interval.open_right

检查右侧间隔是否打开。

Interval.right

右界间隔

时间增量

Timedelta

表示持续时间,即两个日期或时间之间的差值。

性能

Timedelta.asm8

返回自己的numpy timedelta 64数组视图

Timedelta.components

返回一个名为“类耦合”的组件

Timedelta.days

天数。

Timedelta.delta

返回以纳秒( ns )为单位的时间增量,以实现内部兼容性。

Timedelta.freq

-

Timedelta.is_populated

-

Timedelta.max

-

Timedelta.microseconds

微秒数( > = 0小于1秒)。

Timedelta.min

-

Timedelta.nanoseconds

返回纳秒数( n ),其中0≤n < 1微秒。

Timedelta.resolution

返回一个字符串,表示我们拥有的最低分辨率

Timedelta.seconds

秒数( > = 0小于1天)。

Timedelta.value

-

Timedelta.view

阵列视图兼容性

方法

Timedelta.ceil

返回导致此解决方案的新Timedelta CEI

Timedelta.floor

返回一个新的时间增量

Timedelta.isoformat

将时间增量格式化为ISO 8601持续时间,如P [ n ] Y [ n ] M [ n ] DT [ n ] H [ n ] M [ n ] S,其中[ n ] S由值替换。

Timedelta.round

将时间增量舍入到指定的分辨率

Timedelta.to_pytimedelta

返回一个实际的datetime . timedelta对象注意:如果有,我们将丢失纳秒分辨率

Timedelta.to_timedelta64

返回一个精度为“ns”的numpy . timedelta 64对象

Timedelta.total_seconds

时间增量的总持续时间(以秒为单位) (精度为ns )

频率

to_offset(freq)

从字符串或元组表示或datetime . timedelta对象返回DateOffset对象

窗户

滚动对象由返回。点名:Pandas。DataFrame滚动( ),Pandas。Series滚动( )等。扩展对象由返回。扩大通话:Pandas。DataFrame.扩展( ),Pandas。Series.扩展( ),等等。EWM对象由返回。ewm电话:Pandas。DataFrame. ewm ( ),Pandas。Series. ewm ( ),等等。

标准移动窗口功能

Rolling.count()

窗口内任何非南观测的滚动计数。

Rolling.sum(*args, **kwargs)

计算给定DataFrame或Series的滚动和。

Rolling.mean(*args, **kwargs)

计算值的滚动平均值。

Rolling.median(**kwargs)

计算滚动中值。

Rolling.var([ddof])

计算无偏滚动方差。

Rolling.std([ddof])

计算轧制标准偏差。

Rolling.min(*args, **kwargs)

计算滚动最小值。

Rolling.max(*args, **kwargs)

滚动最大值

Rolling.corr([other, pairwise])

滚动样本相关

Rolling.cov([other, pairwise, ddof])

滚动样本协方差

Rolling.skew(**kwargs)

无偏轧制偏度

Rolling.kurt(**kwargs)

计算无偏滚动峰度。

Rolling.apply(func[, raw, args, kwargs])

滚动功能适用

Rolling.aggregate(arg, *args, **kwargs)

使用指定轴上的一个或多个操作聚合。

Rolling.quantile(quantile[, interpolation])

滚动分位数。

Window.mean(*args, **kwargs)

计算值的窗口平均值。

Window.sum(*args, **kwargs)

计算给定DataFrame或Series的窗口和。

标准扩展窗口功能

Expanding.count(**kwargs)

窗口内任何非南观测的扩展计数。

Expanding.sum(*args, **kwargs)

计算给定DataFrame或Series的扩展和。

Expanding.mean(*args, **kwargs)

计算值的展开平均值。

Expanding.median(**kwargs)

计算膨胀中值。

Expanding.var([ddof])

计算无偏扩展方差。

Expanding.std([ddof])

计算扩展标准差。

Expanding.min(*args, **kwargs)

计算扩展最小值。

Expanding.max(*args, **kwargs)

膨胀最大值

Expanding.corr([other, pairwise])

扩展样本相关性

Expanding.cov([other, pairwise, ddof])

扩展样本协方差

Expanding.skew(**kwargs)

无偏膨胀偏度

Expanding.kurt(**kwargs)

计算无偏膨胀峰度。

Expanding.apply(func[, raw, args, kwargs])

扩展函数应用

Expanding.aggregate(arg, *args, **kwargs)

使用指定轴上的一个或多个操作聚合。

Expanding.quantile(quantile[, interpolation])

扩展分位数。

指数加权移动窗函数

EWM.mean(*args, **kwargs)

指数加权移动平均

EWM.std([bias])

指数加权移动标准开发

EWM.var([bias])

指数加权移动方差

EWM.corr([other, pairwise])

指数加权样本相关

EWM.cov([other, pairwise, bias])

指数加权样本协方差

GroupBy

GroupBy对象由GroupBy调用返回:Pandas。DataFrame.群比( ),Pandas。Series. groupby ( ),等等。

索引、迭代

GroupBy.iter()

群比迭代器

GroupBy.groups

dict {组名- >组标签}

GroupBy.indices

dict {组名- >组索引}

GroupBy.get_group(name[, obj])

使用提供的名称从组中构造NDFrame

Grouper([key, level, freq, axis, sort])

groupby允许用户为目标对象指定groupby指令

功能应用

GroupBy.apply(func, *args, **kwargs)

按组应用函数,并将结果组合在一起。

GroupBy.aggregate(func, *args, **kwargs)

-

GroupBy.transform(func, *args, **kwargs)

-

GroupBy.pipe(func, *args, **kwargs)

将带有参数的函数func应用于此groubby对象,并返回函数的结果。

计算/描述统计

GroupBy.all([skipna])

如果组中的所有值都是真实的,则返回True,否则返回False

GroupBy.any([skipna])

如果组中的任何值是真实的,则返回True,否则返回False

GroupBy.bfill([limit])

向后填充值

GroupBy.count()

计算组计数,不包括缺少的值

GroupBy.cumcount([ascending])

将每组中的每个项目编号为0到该组- 1的长度。

GroupBy.ffill([limit])

向前填充这些值

GroupBy.first(**kwargs)

先计算组值

GroupBy.head([n])

返回每个组的前n行。

GroupBy.last(**kwargs)

计算最后一组值

GroupBy.max(**kwargs)

计算组值的最大值

GroupBy.mean(*args, **kwargs)

计算组平均值,不包括缺少的值

GroupBy.median(**kwargs)

计算组的中值,不包括缺少的值

GroupBy.min(**kwargs)

计算组值最小值

GroupBy.ngroup([ascending])

将每个组从0编号到组数- 1。

GroupBy.nth(n[, dropna])

如果n是int,则从每组中取第n行,如果n是int列表,则取行子集。

GroupBy.ohlc()

计算值之和,不包括多个分组的缺失值,结果索引将是多索引

GroupBy.prod(**kwargs)

计算组值乘积

GroupBy.rank([method, ascending, na_option, …])

提供每个组中的值的等级。

GroupBy.pct_change([periods, fill_method, …])

计算每个值到组中先前条目的pct _ change

GroupBy.size()

计算组大小

GroupBy.sem([ddof])

计算组平均值的标准误差,不包括缺失值

GroupBy.std([ddof])

计算组的标准差,不包括缺失值

GroupBy.sum(**kwargs)

计算组值之和

GroupBy.var([ddof])

计算组的方差,不包括缺少的值

GroupBy.tail([n])

返回每个组的最后n行

以下方法在SeriesGroupBy和data framegroupby对象中都可用,但可能略有不同,通常是因为data framegroupby版本通常允许指定axis参数,并且通常是指示是否将应用程序限制在特定数据类型的列的参数。

DataFrameGroupBy.agg(arg, *args, **kwargs)

使用指定轴上的一个或多个操作聚合。

DataFrameGroupBy.all([skipna])

如果组中的所有值都是真实的,则返回True,否则返回False

DataFrameGroupBy.any([skipna])

如果组中的任何值是真实的,则返回True,否则返回False

DataFrameGroupBy.bfill([limit])

向后填充值

DataFrameGroupBy.corr

计算列的成对相关性,不包括NA / null值

DataFrameGroupBy.count()

计算组计数,不包括缺少的值

DataFrameGroupBy.cov

计算列的成对协方差,不包括NA / null值。

DataFrameGroupBy.cummax([axis])

每个组的累计最大值

DataFrameGroupBy.cummin([axis])

每组的累计最小值

DataFrameGroupBy.cumprod([axis])

每组累积产品

DataFrameGroupBy.cumsum([axis])

每组累计金额

DataFrameGroupBy.describe(**kwargs)

生成描述性统计数据,总结数据集分布的中心趋势、分散和形状,不包括NaN值。

DataFrameGroupBy.diff

元素的第一离散差。

DataFrameGroupBy.ffill([limit])

向前填充这些值

DataFrameGroupBy.fillna

使用指定的方法填写NA / NaN值

DataFrameGroupBy.filter(func[, dropna])

返回DataFrame的副本,不包括不满足func指定的布尔条件的组中的元素。

DataFrameGroupBy.hist

制作DataFrame的直方图。

DataFrameGroupBy.idxmax

返回请求轴上首次出现最大值的索引。

DataFrameGroupBy.idxmin

返回请求轴上第一次出现最小值的索引。

DataFrameGroupBy.mad

返回请求轴值的平均绝对偏差

DataFrameGroupBy.pct_change([periods, …])

计算每个值到组中先前条目的pct _ change

DataFrameGroupBy.plot

实现的类。群组依据物件的出图属性

DataFrameGroupBy.quantile

在请求轴上给定分位数的返回值,la numpy .百分位。

DataFrameGroupBy.rank([method, ascending, …])

提供每个组中的值的等级。

DataFrameGroupBy.resample(rule, *args, **kwargs)

使用TimeGrouper时提供Resampling返回带有我们的Resampling器的新grouper

DataFrameGroupBy.shift([periods, freq, axis])

每组按时段移动观察

DataFrameGroupBy.size()

计算组大小

DataFrameGroupBy.skew

返回由N - 1归一化的请求轴上的无偏歪斜

DataFrameGroupBy.take

沿轴返回给定位置索引中的元素。

DataFrameGroupBy.tshift

移动时间索引,使用索引的频率(如果可用)。

以下方法仅适用于SeriesGroupBy对象。

SeriesGroupBy.nlargest

返回最大的n个元素。

SeriesGroupBy.nsmallest

返回最小的n个元素。

SeriesGroupBy.nunique([dropna])

返回组中唯一元素的数量

SeriesGroupBy.unique

返回Series对象的唯一值。

SeriesGroupBy.value_counts([normalize, …])

-

SeriesGroupBy.is_monotonic_increasing

如果对象中的值是单调递增的,则返回boolean

SeriesGroupBy.is_monotonic_decreasing

如果对象中的值是单调递减的,则返回boolean

以下方法仅适用于DataFrameGroupBy对象。

DataFrameGroupBy.corrwith

计算两个DataFrame对象的行或列之间的成对相关性。

DataFrameGroupBy.boxplot([subplots, column, …])

根据DataFrame组制作方框图。

Resampling

Resampling对象通过Resampling调用返回:Pandas。DataFrame.Resampling( ),Pandas。Series.重新取样( )。

索引、迭代

Resampler.iter()

群比迭代器

Resampler.groups

dict {组名- >组标签}

Resampler.indices

dict {组名- >组索引}

Resampler.get_group(name[, obj])

使用提供的名称从组中构造NDFrame

功能应用

Resampler.apply(arg, *args, **kwargs)

使用指定轴上的一个或多个操作聚合。

Resampler.aggregate(arg, *args, **kwargs)

使用指定轴上的一个或多个操作聚合。

Resampler.transform(arg, *args, **kwargs)

调用函数,在每个组上生成一个类似索引的Series,并返回一个带有转换值的Series

Resampler.pipe(func, *args, **kwargs)

将带有参数的函数func应用于此重新采样器对象,并返回函数的结果。

上采样

Resampler.ffill([limit])

向前填充这些值

Resampler.backfill([limit])

在重新采样的数据中向后填充新的缺失值。

Resampler.bfill([limit])

在重新采样的数据中向后填充新的缺失值。

Resampler.pad([limit])

向前填充这些值

Resampler.nearest([limit])

从中心开始用最近邻填充值

Resampler.fillna(method[, limit])

填充上采样引入的缺失值。

Resampler.asfreq([fill_value])

返回新频率的值,本质上是重新索引

Resampler.interpolate([method, axis, limit, …])

根据不同的方法插值。

计算/描述统计

Resampler.count([_method])

计算组计数,不包括缺少的值

Resampler.nunique([_method])

返回组中唯一元素的数量

Resampler.first([_method])

先计算组值

Resampler.last([_method])

计算最后一组值

Resampler.max([_method])

计算组值的最大值

Resampler.mean([_method])

计算组平均值,不包括缺少的值

Resampler.median([_method])

计算组的中值,不包括缺少的值

Resampler.min([_method])

计算组值最小值

Resampler.ohlc([_method])

计算值之和,不包括多个分组的缺失值,结果索引将是多索引

Resampler.prod([_method, min_count])

计算组值乘积

Resampler.size()

计算组大小

Resampler.sem([_method])

计算组平均值的标准误差,不包括缺失值

Resampler.std([ddof])

计算组的标准差,不包括缺失值

Resampler.sum([_method, min_count])

计算组值之和

Resampler.var([ddof])

计算组的方差,不包括缺少的值

风格

styler对象由Pandas返回

样式构造器

Styler(data[, precision, table_styles, …])

使用HTML和CSS帮助根据数据设置DataFrame或Series的样式。

Styler.from_custom_template(searchpath, name)

工厂函数,用于使用自定义模板和Jinja环境创建Styler子类。

样式属性

Styler.env

-

Styler.template

-

Styler.loader

-

样式应用

Styler.apply(func[, axis, subset])

应用函数列、行或表wase,用结果更新HTML表示。

Styler.applymap(func[, subset])

以元素方式应用函数,用结果更新HTML表示。

Styler.where(cond, value[, other, subset])

以元素方式应用函数,用根据函数返回值选择的样式更新HTML表示。

Styler.format(formatter[, subset])

格式化单元格的文本显示值。

Styler.set_precision(precision)

设置用于渲染的精度。

Styler.set_table_styles(table_styles)

在样式器上设置表格样式。

Styler.set_table_attributes(attributes)

设置表属性。

Styler.set_caption(caption)

在样式器上设置标题

Styler.set_properties([subset])

为每个单元格设置一个或多个非数据相关属性的便捷方法。

Styler.set_uuid(uuid)

设置样式器的uuid。

Styler.clear()

“重置”样式器,删除以前应用的任何样式。

内置样式

Styler.highlight_max([subset, color, axis])

通过阴影化背景来突出显示最大值

Styler.highlight_min([subset, color, axis])

通过阴影化背景来突出显示最小值

Styler.highlight_null([null_color])

为缺少的值着色背景null _ color。

Styler.background_gradient([cmap, low, …])

根据每列(可选行)中的数据为背景上色。

Styler.bar([subset, axis, color, width, align])

将背景颜色标记为每列中的值。

样式导出和导入

Styler.render(**kwargs)

将构建的样式渲染为HTML

Styler.export()

导出要应用于当前样式的样式。

Styler.use(styles)

设置当前样式器上的样式,可能使用样式器中的样式。导出

Styler.to_excel(excel_writer[, sheet_name, …])

将样式写入excel工作表

绘图

Pandas绘图模块包含以下功能。

andrews_curves(frame, class_column[, ax, …])

生成Andrews曲线的matplotlib图,用于可视化多变量数据集群。

bootstrap_plot(series[, fig, size, samples])

均值、中值和中值统计的自举图。

deregister_matplotlib_converters()

移除Pandas的格式化程序和转换器

lag_plot(series[, lag, ax])

时间Series的滞后图。

parallel_coordinates(frame, class_column[, …])

平行坐标绘图。

radviz(frame, class_column[, ax, color, …])

在2D中绘制多维数据集。

register_matplotlib_converters([explicit])

用matplotlib注册Pandas格式化程序和转换器

scatter_matrix(frame[, alpha, figsize, ax, …])

绘制散点图矩阵。

通用功能

使用选项

describe_option(pat[, _print_desc])

打印一个或多个已注册选项的说明。

reset_option(pat)

将一个或多个选项重置为默认值。

get_option(pat)

检索指定选项的值。

set_option(pat, value)

设置指定选项的值。

option_context(*args)

上下文管理器在with语句上下文中临时设置选项。

测试功能

testing.assert_frame_equal(left, right[, …])

检查左右DataFrame是否相等。

testing.assert_series_equal(left, right[, …])

检查左右Series是否相等。

testing.assert_index_equal(left, right[, …])

检查左右索引是否相等。

例外和警告

errors.DtypeWarning

从文件读取列中的不同dtypes时发出警告。

errors.EmptyDataError

遇到空数据或标头时在PD . read _ CSV中引发的异常(由C和Python引擎引发)。

errors.OutOfBoundsDatetime

-

errors.ParserError

由PD . read _ CSV中遇到的错误引发的异常。

errors.ParserWarning

读取不使用默认“c”分析器的文件时发出警告。

errors.PerformanceWarning

可能影响性能时发出警告。

errors.UnsortedIndexError

尝试获取多索引切片时引发错误,并且该索引尚未进行词法排序。

errors.UnsupportedFunctionCall

尝试在Pandas对象上调用numpy函数时引发异常,但该对象不支持该函数

数据类型相关功能

api.types.union_categoricals(to_union[, …])

组合类列表类、联合类。

api.types.infer_dtype

有效推断传递的val或类似列表的值数组的类型。

api.types.pandas_dtype(dtype)

将输入转换为仅Pandasdtype对象或numpy dtype对象。

型内省

api.types.is_bool_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为布尔dtype。

api.types.is_categorical_dtype(arr_or_dtype)

检查数组状或dtype是否属于分类dtype。

api.types.is_complex_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为复杂的dtype。

api.types.is_datetime64_any_dtype(arr_or_dtype)

检查提供的数组或dtype是否为datetime64 dtype。

api.types.is_datetime64_dtype(arr_or_dtype)

检查阵列状或dtype是否为datetime64 dtype。

api.types.is_datetime64_ns_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为datetime64 [ ns ] dtype。

api.types.is_datetime64tz_dtype(arr_or_dtype)

检查阵列状或dtype是否为DatetimeTZDtype dtype。

api.types.is_extension_type(arr)

检查类数组是否属于Pandas扩展类实例。

api.types.is_float_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为浮点dtype。

api.types.is_int64_dtype(arr_or_dtype)

检查提供的数组或dtype是否为int64 dtype。

api.types.is_integer_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为整数dtype。

api.types.is_interval_dtype(arr_or_dtype)

检查阵列状或dtype是否为间隔dtype。

api.types.is_numeric_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为数字dtype。

api.types.is_object_dtype(arr_or_dtype)

检查阵列状或dtype是否为物件dtype。

api.types.is_period_dtype(arr_or_dtype)

检查数组类型或dtype是否为周期dtype。

api.types.is_signed_integer_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为带符号整数dtype。

api.types.is_string_dtype(arr_or_dtype)

检查提供的数组或dtype是否为字符串dtype。

api.types.is_timedelta64_dtype(arr_or_dtype)

检查阵列状或dtype是否为timedelta 64 dtype。

api.types.is_timedelta64_ns_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为timedelta 64 [ ns ] dtype。

api.types.is_unsigned_integer_dtype(arr_or_dtype)

检查所提供的数组或dtype是否为无符号整数dtype。

api.types.is_sparse(arr)

检查阵列状是否为Pandas稀疏阵列。

反复反省

api.types.is_dict_like(obj)

检查对象是否像dict一样。

api.types.is_file_like(obj)

检查对象是否为类文件对象。

api.types.is_list_like(obj)

检查对象是否类似列表。

api.types.is_named_tuple(obj)

检查对象是否为命名元组。

api.types.is_iterator(obj)

检查对象是否是迭代器。

标量内省

api.types.is_bool

-

api.types.is_categorical(arr)

检查类数组是否是分类实例。

api.types.is_complex

-

api.types.is_datetimetz(arr)

检查阵列状是否为dtype中含有时区元件的日期时间阵列状。

api.types.is_float

-

api.types.is_hashable(obj)

如果哈希( obj )成功,则返回True,否则返回False。

api.types.is_integer

-

api.types.is_interval

-

api.types.is_number(obj)

检查对象是否为数字。

api.types.is_period(arr)

检查阵列状是否为周期性索引。

api.types.is_re(obj)

检查对象是否为regex模式实例。

api.types.is_re_compilable(obj)

检查对象是否可以编译成regex模式实例。

api.types.is_scalar

如果给定值是标量,则返回True。

延长

这些主要是为图书馆的作者打算扩展Pandas的对象。

api.extensions.register_dataframe_accessor(name)

在DataFrame对象上注册自定义访问者。

api.extensions.register_series_accessor(name)

在Series对象上注册自定义访问者。

api.extensions.register_index_accessor(name)

在索引对象上注册自定义访问者。

api.extensions.ExtensionDtype

自定义数据类型,要与扩展数组配对。

api.extensions.ExtensionArray

自定义一维数组类型的抽象基类。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 开胃菜 2. 使用 Python 解释器 2.1. 调用 Python 解释器 2.1.1. 参数传递 2.1.2. 交互模式 2.2. 解释器及其环境 2.2.1. 错误处理 2.2.2. 执行 Python 脚本 2.2.3. 源程序编码 2.2.4. 交互执行文件 2.2.5. 本地化模块 3. Python 简介 3.1. 将 Python 当做计算器 3.1.1. 数字 3.1.2. 字符串 3.1.3. 关于 Unicode 3.1.4. 列表 3.2. 编程的第一步 4. 深入 Python 流程控制 4.1. if 语句 4.2. for 语句 4.3. The range() 函数 4.4. break 和 continue 语句, 以及循环中的 else 子句 4.5. pass 语句 4.6. 定义函数 4.7. 深入 Python 函数定义 4.7.1. 默认参数值 4.7.2. 关键字参数 4.7.3. 可变参数列表 4.7.4. 参数列表的分拆 4.7.5. Lambda 形式 4.7.6. 文档字符串 4.8. 插曲:编码风格 5. 数据结构 5.1. 关于列表更多的内容 5.1.1. 把链表当作堆栈使用 5.1.2. 把链表当作队列使用 5.1.3. 列表推导式 5.1.4. 嵌套的列表推导式 5.2. del 语句 5.3. 元组和序列 5.4. 集合 5.5. 字典 5.6. 循环技巧 5.7. 深入条件控制 5.8. 比较序列和其它类型 6. 模块 6.1. 深入模块 6.1.1. 作为脚本来执行模块 6.1.2. 模块的搜索路径 6.1.3. “编译的” Python 文件 6.2. 标准模块 6.3. dir() 函数 6.4. 包 6.4.1. 从 * 导入包 6.4.2. 包内引用 6.4.3. 多重目录中的包 7. 输入和输出 7.1. 格式化输出 7.1.1. 旧式的字符串格式化 7.2. 文件读写 7.2.1. 文件对象方法 7.2.2. pickle 模块 8. 错误和异常 8.1. 语法错误 8.2. 异常 8.3. 异常处理 8.4. 抛出异常 8.5. 用户自定义异常 8.6. 定义清理行为 8.7. 预定义清理行为 9. 类 9.1. 术语相关 9.2. Python 作用域和命名空间 9.2.1. 作用域和命名空间示例 9.3. 初识类 9.3.1. 类定义语法 9.3.2. 类对象 9.3.3. 实例对象 9.3.4. 方法对象 9.4. 一些说明 9.5. 继承 9.5.1. 多继承 9.6. 私有变量 9.7. 补充 9.8. 异常也是类 9.9. 迭代器 9.10. 生成器 9.11. 生成器表达式 10. Python 标准库概览 10.1. 操作系统接口 10.2. 文件通配符 10.3. 命令行参数 10.4. 错误输出重定向和程序终止 10.5. 字符串正则匹配 10.6. 数学 10.7. 互联网访问 10.8. 日期和时间 10.9. 数据压缩 10.10. 性能度量 10.11. 质量控制 10.12. “瑞士军刀” 11. 标准库浏览 – Part II 11.1. 输出格式 11.2. 模板 11.3. 使用二进制数据记录布局 11.4. 多线程 11.5. 日志 11.6. 弱引用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值