Pandas
人行花坞
什么事都跟你说的明明白白你就很难成长。
展开
-
Pandas:综合练习
Pandas:综合练习准备import numpy as npimport pandas as pddf = pd.read_csv('data/2002年-2018年上海机动车拍照拍卖.csv')练习一2002 年-2018 年上海机动车拍照拍卖(1) 哪一次拍卖的中标率首次小于 5%?df['Auction winning rate'] = df1['Total numb...原创 2020-05-01 20:37:33 · 279 阅读 · 0 评论 -
Pandas:缺失数据
Pandas:缺失数据Pandas在步入1.0后,对数据类型也做出了新的尝试,尤其是Nullable类型和String类型,了解这些可能在未来成为主流的新特性是必要的import pandas as pdimport numpy as npdf = pd.read_csv('data/table_missing.csv')df.head()一、缺失观测及其类型1. 了解缺失信息...原创 2020-04-30 07:54:51 · 175 阅读 · 0 评论 -
Pandas:合并
Pandas:合并准备环境import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()一、append与assignappend# 利用序列添加行(必须指定name)df_append = df.loc[:3,['Gender','Height']].copy()df_ap...原创 2020-04-29 11:26:04 · 147 阅读 · 0 评论 -
Pandas:变形
Pandas:变形准备环境import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()一、透视表pivot一般状态下,数据在DataFrame会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols:df....原创 2020-04-28 23:02:45 · 223 阅读 · 0 评论 -
Pandas:分组
Pandas 分组初始代码:import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head()SACSAC指的是分组操作中的split-apply-combine过程其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数...原创 2020-04-26 21:38:53 · 162 阅读 · 0 评论