python dataframe 返回接口_初识pandas：一个用于数据分析的Python库

最新推荐文章于 2022-10-18 21:24:24 发布

打盹的咖啡豆

最新推荐文章于 2022-10-18 21:24:24 发布

阅读量264

点赞数

文章标签： python dataframe 返回接口

本文链接：https://blog.csdn.net/weixin_34731836/article/details/113629703

版权

pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming laguage.
From pandas主页

pandas 是基于 NumPy的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。 From 百度百科

一句话：一个用于数据分析的Python库

环境准备

通过命令安装pandas库

pip install -U pandas

学习pandas，建议是在jupyter下进行(https://jupyter.org/)或者在ipython中进行，安装jupyter会自动安装上ipython

pip install -U jupyter

命令行运行jupyter-notebook可以启动jupyter，正常情况下，会以自动用系统默认浏览器打开地址 http://localhost:8889/tree

pip install -U jupyter

命令行运行jupyter-notebook可以启动jupyter，正常情况下，会以自动用系统默认浏览器打开地址 http://localhost:8889/tree

也可以命令行运行ipython使用ipython进行学习，ipython与传统Python终端相比更方便，通过tab键可以快速补全

基本概念

文中涉及到的数据文件来源于https://github.com/tdpetrou/Learn-Pandas

在任何情况下，通过下面方式导入pandas和numpy库

import pandas as pdimport numpy as np

pandas中，最基本、最重要的两个数据类型是DataFrame和Series，可以简单理解为Series是一维数组，DataFrame是二位数组，但又与数组在概念上有很多不同。DataFrame和Series在接口设计上，保持了很多一致的定义，因此，有时候在学习和编码过程中，两者之间有时候感受不到太多差别

movie = pd.read_csv(r'data/movie.csv')movie

DataFrame中，3个非常重要的组件columns、index、values，上图中：

第一行color、director_name...等是columns
第一列0、1、2、3、4是index
第一列和第一列除外的是values

DataFrame可以通过head和tail函数，显示一部分数据，在查看数据的时候非常有用

movie.head()默认显示前5行

给head传入参数，可以显示指定行数，如movie.head(3)显示前3行

tail函数跟head函数用法一样，只是显示最后的指定行数

DataFrame通过列名类似于字典的索引方式访问列，也可以通过点操作类似于访问属性的方式访问列，返回的是Series对象，但是推荐使用索引方式，例如movie['color']或者movie.color

DataFrame的索引访问可以传入一个列名的list，可以返回一个新DataFrame，如movie[['director_name', 'movie_facebook_likes']]

DataFrame的大部分函数和属性的返回值要么是DataFrame要么是Series，所以支持函数和属性的链式调用，例如，获取前100个数据的后10个数据movie.head(100).tail(10)

打盹的咖啡豆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python dataframe 返回接口_初识pandas：一个用于数据分析的Python库

pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming laguage.From pandas主页pandas是基于NumPy的一种工具，该工具是为了解决数据分析任...
复制链接

扫一扫