2.1 pd.生成查看数据

 

import pandas as pd
import numpy as np

 1、生成Series数据表

s = pd.Series([1,3,6,np.nan,44,1])
print(s)
0     1.0
1     3.0
2     6.0
3     NaN
4    44.0
5     1.0
dtype: float64

  2、生成DataFrame数据表

datas = pd.date_range('20160101',periods=6)#  
columns = ['a','b','c','d']
df = pd.DataFrame(np.random.randn(6,4),index=datas,columns=columns)
print(df)
 abcd
2016-01-010.1010340.326522-0.3335751.238334
2016-01-021.035345-0.3262241.0281981.502042
2016-01-03-0.5160771.2781020.569306-0.565420
2016-01-041.585359-0.369289-0.225413-0.057557
2016-01-05-1.180227-0.252925-0.175618-0.781248
2016-01-060.365030-2.304684-0.155198-0.421975

 

df2 = pd.DataFrame({'A':1,
                    'B':pd.Timestamp('20130102'),
                    'C':pd.Series(1,index=list(range(4)),dtype='float32'),
                    'D':np.array([3]*4,dtype='int32'),
                    'E':'foo'})
print(df2)

 

 ABCDF
012013-01-021.03foo
112013-01-021.03foo
212013-01-021.03foo
312013-01-021.03foo
print(df2.dtypes)
A             int64
B    datetime64[ns]
C           float32
D             int32
F            object
dtype: object
print(df2.index)

Int64Index([0, 1, 2, 3], dtype='int64')

print(df2.columns)
Index(['A', 'B', 'C', 'D', 'F'], dtype='object')
print(df2.values)
array([[1, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'foo'],
       [1, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'foo'],
       [1, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'foo'],
       [1, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'foo']], dtype=object)
print(df2.describe())#数据帧描述

 

 ACD
count4.04.04.0
mean1.01.03.0
std0.00.00.0
min1.01.03.0
25%1.01.03.0
50%1.01.03.0
75%1.01.03.0
max1.01.03.0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值