Pandas教程(下)
Pandas教程(下) ,体验数据处理的快感
fire_i_ce
想但V自行车V的V的想
展开
-
Task05:综合练习
问题1(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计 ×× 人付款,单价为 ××。(原创 2020-07-01 23:06:18 · 299 阅读 · 0 评论 -
Task04:时序数据
一、时序的创建1. 四类时间变量现在理解可能关于③和④有些困惑,后面会作出一些说明名称 描述 元素类型 创建方式 ① Date times(时间点/时刻) 描述特定日期或时间点 Timestamp to_datetime或date_range ② Time spans(时间段/时期) 由时间点定义的一段时期 Period Period或period_range ③ Date offsets(相对时间差) 一段时间的相对大小(原创 2020-06-29 22:33:29 · 211 阅读 · 0 评论 -
Task03:分类数据
分类变量的创建及其性质分类变量的创建:pd.Series(["a", "b", "c", "a"], dtype="category") #用Series创建#对DataFrame指定类型创建temp_df = pd.DataFrame({'A':pd.Series(["a", "b", "c", "a"], dtype="category"),'B':list('abcd')})temp_df.dtypes#利用内置Categorical类型创建cat = pd.C原创 2020-06-27 18:16:38 · 147 阅读 · 0 评论 -
Task02:文本数据
String 类型与object的区别string与object的区别string类型和object不同之处有三:① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型② 某些Series方法不能在string上使用,例如: Series.str.decode(),因为存储的是字符串而不是字节③ string类型在缺失值存储或运算时,类型会广播为pd.NA,而不是浮点型np.nan原创 2020-06-27 17:40:42 · 180 阅读 · 0 评论 -
Task01:缺失数据
对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补。对于主观数据,人将影响数据的真实性,存在缺失值的样本的其他属性的真实值不能保证,那么依赖于这些属性值的插补也是不可靠的,所以对于主观数据一般不推荐插补的方法。插补主要是针对客观数据,它的可靠性有保证。 1234 import pandas as pdimport numpy as npdf = pd.read_csv('data/table_missing.csv')df.head()原创 2020-06-23 21:38:06 · 212 阅读 · 0 评论