[Python] Pandas 学习笔记(一)

最新推荐文章于 2022-06-08 15:57:26 发布

multiangle

最新推荐文章于 2022-06-08 15:57:26 发布

阅读量1.9k

点赞数

分类专栏： python 文章标签： python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014595019/article/details/49718195

版权

python 专栏收录该内容

39 篇文章 15 订阅

订阅专栏

Pandas的两个主要数据结构：Series和DataFrame

Series

1.类似于一维数组对象，由一组数据（value）和一组与之相关的数据标签（index）组成。

2.Index可以自己指定，也可自动生成

obj = Series([4,7, -5, 3])

obj2 =Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])

3.与Numpy相比，pandas可以通过index选取Series中的单个或者一组值

4.Python字典格式数据可以直接创建Series

5. In[20]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}

In[23]: states = ['California', 'Ohio', 'Oregon', 'Texas']

In [24]: obj4 =Series(sdata, index=states)

In [25]: obj4

Out[25]: California NaN

Ohio 35000

Oregon 16000

Texas 71000

6.pandas.isnull/notnull 可以用于检测缺失数据

7.Series的一个非常重要的功能是，能自动对齐不同索引的数据

8.Series以及Series.index都有一个name属性

DataFrame

1.DataFrame是一个表格型的数据结构，含有一组有序的列。DataFrame既有行索引也有列索引。

2.DataFrame的几种常用构造方法：

2.1 输入一个多维数组 DataFrame([[1,2,3],[4,5,6],[7,8,9]])

也可以指定index和column

这时可以用DataFrame.d/e/f 或者DataFrame[‘d’]/[‘e’]/[‘f’]来表示相应的列。但是，只能从columns中选，不能从index中选

2.2 输入由Numpy数组组成的字典

2.3输入嵌套字典

3.在对列进行赋值时，可以使用常数，或者数组，也可以是Series

4.为不存在的列赋值会创建出一个新列

5.关键词del用于删除列

6.Index的方法以及属性

7.Series.reindex(name_list)调用Series的reindex方法会根据新索引进行重排。如果索引值当前并不存在，则引入缺失值,使用fill_value=0选项能够填充缺失值

8.reindex的method选项：ffill/pad/bfill/backfill 但是在DataFrame中，method方法只能按行应用

9.DataFrame的reindex()可以修改索引，.reindex(columns=…)可以修改列

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。