data pandas包应用

## 日期时间处理 和 单极 索引处理

首先先导包

import pandas as pd
data = pd.read_csv('D:/city_temperature.csv',dtype= {'State':object})

 

如果直接用数组访问方式会有数据类型不匹配的问题

因为数据集的年月日都是int类型,你和一个字符相加 不能拼接

data['Date'] = data['Year'].astype(str) + '/' + data['Month'].astype(str)+'/' + data['Day'].astype(str)

 

用pandas包自带的datetime方法

data['Date'] = pd.to_datetime(data['Date'],format = '%Y/%m/%d',errors = 'coerce') # 大写Y四位数 

其中如果当前方法准确来说是没有问题,但是少部分有问题的日期用errors =’coerce‘抑制

 

date数组访问方式可以用.dt属性来访问

data['Date'].dt.dayofweek

 

### 单级索引处理

默认情况下,pandas提供一个从0开始的自然数索引

可以自定义索引,其优点如下:

提供快速访问行列数据的机制

提高快速访问行列数据的机制

支持数据自动对齐功能

支持数据连接等复杂数据操作功能

data.query('City == "Shanghai"')

data['Shangahi','2013/1/1']

## 先了解reset_index()的作用:

将当前索引列复原为普通列,并重新指定一个默认索引

data.reset_index().reset_index()

set_index(,inplace = True) :设置索引列,将经常进行查询的列设置为索引列

data.set_index('City',inplace = True)

 #基于索引的查询 data.loc[] 也可以使用 data.query('City==' 或 data.query('index =='))

data.loc 是基于索引的查询

data.iloc 是基于位置的查询,与索引无关

 

 

### 练习1:查询广州的所有记录
### 练习2:查询上海和广州的所有记录,只显示AvgTemperature
### 练习3:查询上海和广州的所有气温值大于30的数据,显示Date和AvgTemperature列
### 练习4:查询上海<font color=red>到</font>广州的所有数据
### 练习5:查询广州<font color=red>到</font>上海的所有数据 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值