利用Python数据分析：pandas入门（二）

最新推荐文章于 2024-05-23 15:12:49 发布

kkbb8811

最新推荐文章于 2024-05-23 15:12:49 发布

阅读量396

点赞数

分类专栏： Python数据分析

本文链接：https://blog.csdn.net/kkbb8811/article/details/55006463

版权

这篇博客介绍了如何使用Python的pandas库创建和操作DataFrame。内容包括从字典创建DataFrame，指定列顺序，设置索引，获取和设置列，删除列，布尔索引，以及DataFrame的转置和数值数据的获取。示例展示了如何处理缺失值，以及如何通过嵌套字典创建DataFrame，并设置了索引和列的名称。

摘要由CSDN通过智能技术生成

import pandas as pd
import numpy as np
from pandas import Series,DataFrame
data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
        'year':[2000,2001,2002,2001,2002],
        'pop':[1.5,1.7,3.6,2.4,2.9]}
frame = DataFrame(data)
frame #可以把字典，等长的列表转换成一个 dataframe dataframe有行索引也有列的索引
DataFrame(data,columns=['year','state','pop']) #指定列的顺序，DataFrame就会按照指定的顺序进行排列
frame2 = DataFrame(data,columns=['year','state','pop','debt'],
                   index=['one','two','three','four','five'])
frame2 # 如果列找不到就会返回一个NAN 这里同样的可以将1~N-1的索引改成指定索引
frame2.columns # 返回列的信息
frame2['state'] #通过字典标记方式可以将dataframe的列获取为一个Series
frame2.year # 同上
frame2['state'].name # 返回的Series的name属性也是设置好的
frame2['state'].index.name
frame2.ix['three'] # 行可以通过为止