自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 综合练习

仅作学习打卡使用。一、端午节的淘宝粽子交易问题(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将类别结果插入到标题一列之后,最后对类别列进行降序排序。(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充。(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为××,共计

2020-07-01 21:44:33 134

原创 时序数据

时序的创建一、 四类时间变量二、 时间点的创建1.to_datetime方法对于DataFrame而言,如果列已经按照时间顺序排好,则利用to_datetime可自动转换2.时间精度与范围限制Timestamp的精度可以最小到纳秒ns,它带来范围的代价就是只有大约584年的时间点是可用的3.date_range方法一般来说,start/end/periods(时间点个数)/freq(间隔方法)是该方法最重要的参数,给定了其中的3个,剩下的一个就会被确定其中freq参数有许多选项

2020-06-29 21:30:12 435

原创 分类数据

(一)、category的创建及其性质一、 分类变量的创建1.用Series创建2.对DataFrame指定类型创建3.利用内置Categorical类型创建4.利用cut函数创建默认使用区间类型为标签可指定字符为标签二、分类变量的结构一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order)从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量下面介绍如何获取或修改这些属性1.describe方法该方法描述了一个分

2020-06-27 21:35:55 2170

原创 文本数据

文本数据一、string类型的性质(一)、 string与object的区别string类型和object不同之处有三:1.字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型2. 某些Series方法不能在string上使用,例如: Series.str.decode(),因为存储的是字符串而不是字节3. string类型在缺失值存储或运算时,类型会广播为pd.NA,而不是浮点型n

2020-06-26 21:22:08 897

原创 Pandas 学习

Task01-缺失数据缺失值观测及其类型一、了解缺失信息 (1) isna和notna方法isna确定哪些是缺失值而notna确定哪些是非缺失值df.isna().sum() 查看有多少缺失值 等同于 pd.isnull(df).sum()通过df.info()查看缺失信息 (2) 查看所有存在缺失值的行df[df['colname'].isna()]--查看某一列中所有存在缺失值的行 (3) 挑选出所有非缺失值列df[df.notna().all(1)]--...

2020-06-23 22:53:01 225

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除