pandas一般用于读取.csv文件,有些类似于电子表格,使用Python进行数据处理时经常会用到,以前学过一次,总不用容易忘记,再次简单记录。
- Pandas基础
#Pandas 基础
import pandas as pd
import numpy as np
np.random.seed(1)
dates = pd.date_range('20181001',periods = 6)
s = pd.Series([1,2,np.nan,0,8,9],index = dates)
df = pd.DataFrame(np.random.randn(6,5),index = [2,3,1,0,9,6],columns = [i for i in 'acbed'])
df1 = pd.DataFrame(np.random.randn(6,4))
dic = {'a':[1.,2],'b':[2,3],'c':[3,4],'d':[4,5]}
df2 = pd.DataFrame(dic,index = ['a','b']) #字典里的key为列,values是每列的数据
print(df)
df2.dtypes #查看dataframe的数据类型
df2.index #查看dataframe的行号
df2.columns #查看dataframe的列号
df2.values #查看dataframe的值(内容),即去掉行标签和列标签的纯数组形式,可转换成numpy进行后续操作。
df.describe() #描述dataframe的属性(一般针对于数字操作)
df.sort_index(axis = 1,ascending=Fals