Big Data
liuke0002
IT屌丝!
展开
-
pandas基本功能(续1)
丢弃指定轴上的项 丢弃某条轴上的一个或多个项很简单,只要有一个索引数组或列表即可。由于需要执行一些数据整理和集合逻辑,所以drop方法返回的是一个在指定轴上删除了指定值的新对象: 对于DataFrame,可以删除任意轴上的索引值: 索引、选取和过滤 Series索引(obj[...])的工作方式类似于NumPy数组的索引,只不过Series的索引值不只是整数。下原创 2018-01-21 23:46:16 · 306 阅读 · 0 评论 -
pandas数据结构介绍
pandas是基于NumPy构建的,它以NumPy为中心的应用变得更加简单。 pandas的数据结构介绍 Series Series是一种类似于一维数组的对象,它由一组数据(各种Numpy的数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据即可产生最简单的Series obj=Series([4,7,-5,3]) Series的字符串表现形式为:索引在左边,值在右边。由于我原创 2018-01-17 00:32:31 · 531 阅读 · 1 评论 -
pandas基本功能(续2)
函数应用和映射 NumPy的ufuncc(元素级数组方法)也可用于操作pandas对象: 另一个常见的操作是,将函数应用到由各列或行所形成的一维数组上。DataFrame的apply方法即可实现此功能: 许多最为常见的数组统计功能都能被实现成DataFrame的方法(如sum和mean),因此无需使用apply方法。 除标量值外,传递给apply的函数换可以返回由多个值原创 2018-01-24 02:02:58 · 237 阅读 · 0 评论 -
Python numpy
将条件逻辑表示为数组运算 numpy.where函数是三元表达式x if condition else y的矢量化版本。 numpy.where(cond,arr1,arr2) 数学和统计方法 可以通过数组上的一组数学函数对整个数组或某个轴向的数据进行统计运算。sum、mean以及标准差std等聚合计算(sggregation,通常叫做约简(reduction))既可以当作实例方法调用,也原创 2018-01-06 18:11:43 · 576 阅读 · 1 评论 -
pandas基本功能
重新索引 pandas对象的一个重要方法是reindex,其作用是创建一个适应新索引的新对象。 调用该Series的reindex将会根据新索引进行重排。如果某个索引当前值不存在,就引入缺失值 对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理。method选项即可达到此目的,例如,使用ffill可以实现前向值填充: reindex的(插值原创 2018-01-19 02:50:54 · 497 阅读 · 0 评论 -
层次化索引
层次化索引是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以降低唯独形式处理高维度数据。 带有MultiIndex索引的Series的格式化输出格式。索引之间的"间隔"表示"直接使用上面的标签": 对于一个层次化的索引的对象,选取数据子集的操作很简单: 有时甚至还可以在"内层"中进行选取: 层次化索原创 2018-02-12 02:01:02 · 5260 阅读 · 0 评论 -
pandas中的绘图函数
不难看出,matplotlib实际上是一种比较低级的工具。要组装一张图表,你得用它的各种基础组件才行:数据展示(即图表类型:线型图、柱状图、盒形图、散步图、等值线图等)、图例、标题、刻度标签以及其他注解型信息。这是因为要根据数据制作一张完整图表通常都需要用到多个对象。在pandas中,我们有行标签、列标签以及分组信息。这也就是说,要制作一张完整的图表,原本需要一大堆的matplotlib代码,现在...原创 2018-05-11 03:17:15 · 952 阅读 · 0 评论