Pnadas学习day-01

本文介绍了Pandas库的基本使用,包括导入Pandas,Series和DataFrame两种核心数据结构,数据查看,读取及操作,如条件选择、缺失值和异常值处理。详细讲解了如何通过索引和列标签进行数据选择和操作。
摘要由CSDN通过智能技术生成

Pandas学习day-01

导入Pandas

import pandas as pd
import numpy as np

Pandas基本数据结构

pandas中有两种基本结构

Series

一维数组,与numpy中得array类似,与python中的基本数据结构List也相近。Series能保存不同的数据类型。

DataFrame

二维的表格型数据结构。

Pandas的Series类型

一维Series可以用一维列表初始化

s=pd.Series([1,3,5,np.nan,6,8])
s
0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64
s=pd.Series([1,3,5,np.nan,6,8],index=['a','b','c','d','e','f'])
s
a    1.0
b    3.0
c    5.0
d    NaN
e    6.0
f    8.0
dtype: float64

索引数据的行标签

s.index
Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')

s.values
array([ 1.,  3.,  5., nan,  6.,  8.])
s[0]
1.0
s[3]
nan

切片操作

s[2:5]
c    5.0
d    NaN
e    6.0
dtype: float64
s[::2]
a    1.0
c    5.0
e    6.0
dtype: float64

索引赋值

s.index.name='索引'
s
索引
a    1.0
b    3.0
c    5.0
d    NaN
e    6.0
f    8.0
dtype: float64

pandas的DataFrame类型

构造一个时间序列

date=pd.date_range('20180101',periods=6)
date
DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04',
               '2018-01-05', '2018-01-06'],
              dtype='datetime64[ns]', freq='D')

传入二维数组

df=pd.DataFrame(np.random.randn(6,4),index=date,columns=list('ABCD'))
df
A B C D
2018-01-01 0.276367 0.235869 -0.863373 0.785798
2018-01-02 -0.585890 0.142942 -0.504779 -1.370040
2018-01-03 -0.607308 -0.983548 0.310815 0.338497
2018-01-04 0.025879 -0.442640 -0.862432 1.204614
2018-01-05 -0.278121 0.272711 0.491046 -0.114447
2018-01-06 -0.042118 -0.761489 -2.086405 -0.566671

使用字典传入数据

df2=pd.DataFrame({
   'A':1,
                 'B'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值