pandas 切片_数据分析-pandas库快速了解

#「闪光时刻」主题征文 二期#

Pandas是Python第三方库,提供高性能易用数据类型和分析工具,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

与numpy对比区别:

ad9f237bc39124ba7ea0ad485af766f3.png

image

2.pandas库怎么用

安装

pip install pandas

导入

import pandas as pd

3.pandas两个数据类型

两个数据类型:Series, DataFrame

Series类型

Series类型由一组数据及与之相关的数据索引组成

12c681cfda32701b68fb7f5a3f21fa66.png

image

第一列的0,1,2,3是自动索引,第二列是实际数据值,最后的dtype表示数据类型

7467167e3ed74888d6879c92695861be.png

image

Series类型数据的常见创建方式

python列表

a2a4a6deba539dba8051d557b986e969.png

image

标量值

b35143c111f829fd3ee59890c6a524c2.png

image

python字典

638060f7a897e1075f8b4192408a411c.png

image

ndarray

e57180f5a1c08e50050b193d7cb0d7e0.png

image

Series类型数据的基本操作

获得索引和数据

50603e45a8ef64463e0e38b1a5caa8da.png

image

更改索引

28edeadfc849eea58e25461ebc029e60.png

image

索引

464018400f124b8d55fa58430a9ef54e.png

image

切片

7b176bfb410d8639f69a09a3e108ccaf.png

image

DataFrame类型

DataFrame类型由共用相同索引的一组列组成,是一个表格型的数据类型,每列值类型可以不同,既有行索引、也有列索引,常用于表达二维数据。

bcc5d2b2e96b84b39b117d5f12cf4412.png

image

146b6de5a1fbaf304b7eb185b4b03672.png

image

DataFrame类型数据的常见创建方式

二维ndarray对象

e0937ae7c2de96c1548423f076f7974e.png

image

一维ndarray、列表、字典、元组或Series构成的字典

c28872e4f46a62d526060cfd12b77922.png

image

5a5ac8cc266cf4474d017152b060f2e9.png

image

f9c652e6c396281cbff859114a679e83.png

image

DataFrame类型数据的基本操作

获得行列索引和数据

eb38a1c2759fc664096907841e6e50e5.png

image

更改行列索引

5dbd9656d7a492d214b166f53e63c682.png

image

选择数据

索引切片获取列数据和单个数据

76497c0110fe9bb3d89046c788a38cb9.png

image

索引切片获取行数据

e664143e7c75d97b193092089f075288.png

image

iloc():按照索引的位置来选取,这里要注意这种方式是包含切片的末尾的数据的

1460637665e5df9338bc20774769786a.png

image

loc():按照索引index的值选取,如果没有自定义值,行数据也可以通过切片获取。

c63c04fa9353ccaaba5a8b3f394531e0.png

image

72afc0794438daaf3e459b5a9855da97.png

image

a016a028a0d59733f532b5ba5b980a2e.png

image

4.查看数据

96e66597db39a8aa6edbaa0e5bbb9d15.png

imag数据分析-pandas库快速了解e

5.文件数据读取和保存

保存

6222b2c919d89ffe3ed641c7e054ffa8.png

image

读取

这里多了一列数据是因为上面写入时把索引写入了,可以再写入时去掉index,to_csv(file,index=False)

5893d5bc0f0a26afc2964aee43da2a24.png

image

限于篇幅原因,还有更多内容(空值处理,分组,合并,排序,删除等),这个会在后面的具体场景中应用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值