自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 综合练习下(未完成)

一、端午节的淘宝粽子交易(参考大佬的)(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。import pandas as pddata = pd.read_csv("端午粽子数据.csv")# (1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。data.columns = data.columns.str.strip()data = data.dropna(subset=['发货地址'])py =data[data['发货地址'].str.contain

2020-07-01 20:47:21 175

原创 时序

一、时序的创建1. 四类时间变量现在理解可能关于③和④有些困惑,后面会作出一些说明名称 描述 元素类型 创建方式① Date times(时间点/时刻) 描述特定日期或时间点 Timestamp to_datetime或date_range② Time spans(时间段/时期) 由时间点定义的一段时期 Period Period或period_range③ Date offsets(相对时间差) 一段时间的相对大小(与夏/冬令时无关) DateOffset DateOffset④ Time

2020-06-29 21:23:03 389

原创 分类数据

分类数据一、category的创建及其性质1. 分类变量的创建(a)用Series创建(b)对DataFrame指定类型创建(c)利用内置Categorical类型创建(d)利用cut函数创建默认使用区间类型为标签可指定字符为标签2. 分类变量的结构一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order)从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量下面介绍如何获取或修改这些属性(a)describe方法该方法描述

2020-06-27 19:55:03 1012

原创 第7章 文本数据

这里写自定义目录标题一、string类型的性质1. string与object的区别2. string类型的转换合理的创建标题,有助于目录的生成二、拆分与拼接1. str.split方法2. str.cat方法三、替换1. str.replace的常见用法2. 子组与函数替换3. 关于str.replace的注意事项四、子串匹配与提取1. str.extract方法2. str.extractall方法3. str.contains和str.match五、常用字符串方法1. 过滤型方法2. isnumeri

2020-06-26 15:13:13 387

原创 第六章缺失值处理pandas

目录标题第六章缺失数据缺失观测及其类型检测缺失值isna和notna返回布尔值isna()是查找是缺失值的返回True,反之Falsenotna()查找不是缺失值的,返回值跟上面相反可以添加sum()来统计每行每列的缺失值个数也可以通过info来查看缺信息np.nan的几个知识点Nullable类型与NA符号Nullable整形Nullable布尔string类型NA的特性逻辑运算算术运算和比较运算convert_dtypes方法缺失数据的运算与分组加号与乘号规则groupby方法中的缺失值填充与剔除fil

2020-06-23 15:09:17 1130

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除