pandas阅读笔记<1>

本文记录了学习pandas库的过程,包括使用read_table()读取数据,通过merge()合并DataFrame,以及利用pivot_table()进行数据分析。重点讨论了各函数参数的理解与应用,如pivot_table的data、values、index、columns和aggfunc参数。文中提到,通过这些基础操作,能对数据进行初步的统计和分析。
摘要由CSDN通过智能技术生成

这几天在阅读python的pandas库。现在还在阅读第二章的内容,在第二章中又一个实例,有一个关于电影数据的数据集,然后,我们对它做一些简单的分析,做个今天学习的总结。

Part 1 读取数据

首先使用的是pandas的read_table函数,函数主要又以下几个参数:
filepath_or_buffer:该参数主要是要读取数据集的路径
sep : 该参数主要是用来在读取文件时候,遇到分隔符时读取不同的数据。
headers:在pandas的文档中的定义如下:
参数headers
一般使用的时候都是将这个参数设为None,如果把它设为0的时候,它就会从第二个数据开始读入。所以传入一个整数n的时候,我一般是理解成它是都从n+2开始读取数据(这里没有考虑数据集刚开始有无关元素的情况)。传入一个list的时候没有试过,这里就不敢乱说。
names: 这个参数主要是一个list用来存储列对应的名字。
engine : 这个参数书中是没有设定的,但是编译的过程老是有个warning。用于设定使用那个解析器引擎。
读取文件的使用使用到的主要是这样几个参数。

Part 2 两个Data Frame进行merge操作

关于两项数据的合并操作感觉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值