博客专栏  >  云计算/大数据   >  pandas入门教程

pandas入门教程

pandas是基于numpy的一种工具,提供了解决数据分析任务而创建的,pandas容纳了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,是作为数据分析不可或缺的工具。

关注
0 已关注
18篇博文
  • pandas保存文件

    1、使用DataFrame的to_csv函数保存文件 在使用DataFrame的to_csv保存文件的时候,会默认使用逗号作为分隔符,如果没有设置行列索引,也没有禁用行列索引保存的话,保存文件的时候...

    2018-01-14 21:30
    27
  • pandas逐块读取文件

    使用pandas来处理文件的时候,经常会遇到大文件,而有时候我们只想要读取其中的一部分数据或对文件进行逐块处理。 data.csv 1、读取文件中前部分 通过nrows参数,来设置读取文...

    2018-01-14 21:24
    30
  • 使用pandas读取文件

    pandas可以将读取到的表格型数据(文件不一定要是表格)转成DataFrame类型的数据结构,然后我们可以通过操作DataFrame进行数据分析,数据预处理以及行和列的操作等。下面介绍一些常用读取文...

    2018-01-14 16:19
    50
  • pandas的整数索引

    在使用pandas的过程也许你遇到过一个比较头疼的问题,为什么有的时候能用整数索引有的时候又不能用,下面我们就一起来看一下为什么。 一、Series的整数索引 s = pd.Series(...

    2018-01-11 22:01
    13
  • pandas将DataFrame的列变成行索引

    pandas提供了set_index方法可以将DataFrame的列(多列)变成行索引,通过reset_index方法可以将层次化索引的级别会被转移到列里面。 1、DataFrame的set_ind...

    2018-01-11 21:50
    27
  • pandas的层次化索引

    一、层次化索引 层次化索引(hierarchical indexing)是pandas的一个重要的功能,它可以在一个轴上有多个(两个以上)的索引,这就表示着,它能够以低维度形式来表示高维度的数据。 ...

    2018-01-10 21:49
    31
  • pandas处理缺失值

    在实际应用中对于数据进行分析的时候,经常能看见缺失值,下面来介绍一下如何利用pandas来处理缺失值。常见的缺失值处理方式有,过滤、填充。 一、缺失值的判断 pandas使用浮点值NaN(Not ...

    2018-01-09 20:59
    17
  • pandas的唯一值、值计数以及成员资格

    1、Series唯一值判断 s = Series([3,3,1,2,4,3,4,6,5,6]) #判断Series中的值是否重复,False表示重复 print(s.is_u...

    2018-01-08 21:55
    52
  • pandas的相关系数与协方差

    1、输出百分比变化以及前后指定的行数 a = np.arange(1,13).reshape(6,2) data = DataFrame(a) #计算列的百分比变化,如果想计...

    2018-01-08 21:36
    42
  • pandas的汇总和计算描述统计

    pandas提供了很多常用的数学和统计方法,其中大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。 一、DataF...

    2018-01-07 21:37
    41
  • pandas带有重复索引操作

    有的时候,可能会遇到表格中出现重复的索引,在操作重复索引的时候可能要注意一些问题。 一、判断索引是否重复 a、Series索引重复判断 s = Series([1,2,3,4,5],in...

    2018-01-07 15:38
    48
  • pandas的排序和排名

    有的时候我们可以要根据索引的大小或者值的大小对Series和DataFrame进行排名和排序。 一、排序 pandas提供了sort_index方法可以根据行或列的索引按照字典的顺序进行排序 a...

    2018-01-07 13:17
    81
  • pandas的函数应用和映射

    我们可以定义函数,来应用到DataFrame指定的行或者列上。 一、通过apply使用自定义函数 #使用python的lambda定义函数 f = lambda x : x.max...

    2018-01-06 21:45
    28
  • pandas的算术运算和数据对齐

    pandas可以对不同索引的对象进行算术运算,如果存在不同的索引对,结果的索引就是该索引对的并集。 一、算术运算 a、series的加法运算 s1 = Series([1,2,3],...

    2018-01-06 19:34
    38
  • pandas的基本操作

    1、reindex重新索引 pandas提供了一个reindex方法来创建一个适应新索引的新对象,Serires通过调用reindex方法会根据新索引的顺序重新排序,如果新的索引中存在原索引中不存在...

    2018-01-03 22:44
    33
  • pandas的索引对象

    pandas两个最重要的数据结构Series和DataFrame都具备索引,pandas的索引对象负责管理轴标签和其他元数据(如轴名称等)。在创建Series或DataFrame的时候,用到的数组或其...

    2018-01-03 21:34
    24
  • pandas的数据结构之DataFrame

    DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同数据类型的数据。DataFrame既有行索引也有列索引,可以将它看作为一个由Series组成的字典(共用同一个索引)。Dat...

    2018-01-02 21:42
    48
  • pandas的数据结构之Series

    pandas有两个最主要的数据结构Series和DataFrame,要想熟练的运用pandas进行数据分析,离不开Series和DataFrame的运用。Series是一种类似于一维数组的对象,它是由...

    2018-01-02 20:11
    31
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部