python dataframe 返回接口_初识pandas:一个用于数据分析的Python库

pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming laguage.
From pandas主页
pandas 是基于 NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 From 百度百科

一句话:一个用于数据分析的Python库

环境准备

通过命令安装pandas

pip install -U pandas

学习pandas,建议是在jupyter下进行(https://jupyter.org/)或者在ipython中进行,安装jupyter会自动安装上ipython

pip install -U jupyter

命令行运行jupyter-notebook可以启动jupyter,正常情况下,会以自动用系统默认浏览器打开地址 http://localhost:8889/tree

pip install -U jupyter

命令行运行jupyter-notebook可以启动jupyter,正常情况下,会以自动用系统默认浏览器打开地址 http://localhost:8889/tree

89647d32bfd99933051fdde033954a3e.png

7a5b2e23f3e4cedd31f5b99e669c69e1.png

也可以命令行运行ipython使用ipython进行学习,ipython与传统Python终端相比更方便,通过tab键可以快速补全

ae8f12a49b42536b705ed61fa6a52f9d.png

基本概念

文中涉及到的数据文件来源于https://github.com/tdpetrou/Learn-Pandas

在任何情况下,通过下面方式导入pandasnumpy

import pandas as pdimport numpy as np

pandas中,最基本、最重要的两个数据类型是DataFrameSeries,可以简单理解为Series是一维数组,DataFrame是二位数组,但又与数组在概念上有很多不同。DataFrameSeries在接口设计上,保持了很多一致的定义,因此,有时候在学习和编码过程中,两者之间有时候感受不到太多差别

movie = pd.read_csv(r'data/movie.csv')movie

b43fda16dd6b5f2a613b793c49397f55.png

DataFrame中,3个非常重要的组件columnsindexvalues,上图中:

  • 第一行colordirector_name...等是columns

  • 第一列0、1、2、3、4index

  • 第一列和第一列除外的是values

DataFrame可以通过headtail函数,显示一部分数据,在查看数据的时候非常有用

  • movie.head()默认显示前5行

9a094f656cc7f1d87889230a0b7d09df.png

  • head传入参数,可以显示指定行数,如movie.head(3)显示前3行

6971f2bfab4c1b73969cd36343d0e3f6.png

  • tail函数跟head函数用法一样,只是显示最后的指定行数

DataFrame通过列名类似于字典的索引方式访问列,也可以通过点操作类似于访问属性的方式访问列,返回的是Series对象,但是推荐使用索引方式,例如movie['color']或者movie.color

c87d55eda101243dd789cd41964b4fc8.png

DataFrame的索引访问可以传入一个列名的list,可以返回一个新DataFrame,如movie[['director_name', 'movie_facebook_likes']]

7cc6423a3b8cb0cc8a3b5f63959ef5d3.png

DataFrame的大部分函数和属性的返回值要么是DataFrame要么是Series,所以支持函数和属性的链式调用,例如,获取前100个数据的后10个数据movie.head(100).tail(10)

d503308e34083fbae44d5debf228e2f7.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值