本文用于学习pandas模块的基本使用方法!!!
from pandas import *
#import pandas as pd
import numpy as np
#读取csv、xlsx文件,获得DataFrame数据结构
#data = pd.read_csv('filename.csv',header=None)
#data = pd.read_excel('filename.xlsx')
#将DataFrame数据结构保存为csv文件
#data.to_csv('filename.csv',header=None,index=False)
'''
数据结构:Series
Series:由numpy数据类型和与之对应的索引组成
'''
#创建Series数据结构
obj = Series([3,2,1])
print(obj)
#获得Series数据结构对象的数据和索引
print(obj.values)
print(obj.index)
#获得唯一值组成的数组
print(obj.unique())
#获得各值出现的频率
print(obj.value_counts())
#判断缺失数据 True表示缺失
obj = Series([1,np.nan,2,np.nan,3,np.nan])
print(obj.isnull())
print(isnull(obj))
print(notnull(obj))
print(obj.notnull())
#删除缺失值
print(obj.dropna())
print(obj[obj.notnull()])
#对数据标记索引
obj = Series([1,2,3,4],index=['a','b','c','d'])
#通