读写不同数据源的数据
1、数据库数据读取
2、文本文件储存
读写Excel文件
掌握DataFrame的常用操作
查看DataFrame的常用属性
基础属性
查改增删dataframe数据
1、查看访问DataFrame数据——基本查看方式
data['dishes_name']
data.dishes_name#不建议使用,易与属性方法混淆
dataframe具有行名称和列名称,所以除了用名称索引之外,还可以用行列号索引。
data.iloc[2,2]
data.loc[2,'dishes_id']
loc前后均闭的区间,iloc前闭后开区间
也可以用delete
del data2['detail_id']
描述分析DataFrame数据
1、数值型
data2.mean()#部分字符型数据不进行计算,只对数值型计算
2、类别型
转换与处理时间序列
pandas事件相关的类
data['lock_time']=pd.to_datetime(data['lock_time'])#赋值才会对原值有改变
timestamp是有时间范围限制的,不能超过这个时间范围
提取时间序列数据信息
Timestamp类常用属性
加减时间数据
Timedelta类
使用分组聚合进行组内计算
聚合:依照一个或几个字段对数据分组,并且对每个分组应用一个函数,pandas提供groupby方法进行分组
使用groupby方法拆分数据
groupby方法的参数及其说明
GroupBy对象常用的描述性统计方法
使用agg方法聚合数据
agg和aggregate函数参数机器说明
agg方法求统计
data_gb.agg(np.sum)#可灵活应用函数
data_gb.sum()#只提供部分功能
agg方法与自定义函数
apply
#结果一样,但是apply无法针对字段进行单独的聚合
data[['counts','amounts']].apply(np.sum)
data[['counts','amounts']].agg(np.sum)
使用transform方法聚合数据
创建透视表与交叉表
透视表是数据分析常用工具之一,根据一个或多个键进行聚合