- 博客(5)
- 收藏
- 关注
原创 综合练习下(未完成)
一、端午节的淘宝粽子交易(参考大佬的)(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。import pandas as pddata = pd.read_csv("端午粽子数据.csv")# (1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。data.columns = data.columns.str.strip()data = data.dropna(subset=['发货地址'])py =data[data['发货地址'].str.contain
2020-07-01 20:47:21 175
原创 时序
一、时序的创建1. 四类时间变量现在理解可能关于③和④有些困惑,后面会作出一些说明名称 描述 元素类型 创建方式① Date times(时间点/时刻) 描述特定日期或时间点 Timestamp to_datetime或date_range② Time spans(时间段/时期) 由时间点定义的一段时期 Period Period或period_range③ Date offsets(相对时间差) 一段时间的相对大小(与夏/冬令时无关) DateOffset DateOffset④ Time
2020-06-29 21:23:03 389
原创 分类数据
分类数据一、category的创建及其性质1. 分类变量的创建(a)用Series创建(b)对DataFrame指定类型创建(c)利用内置Categorical类型创建(d)利用cut函数创建默认使用区间类型为标签可指定字符为标签2. 分类变量的结构一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order)从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量下面介绍如何获取或修改这些属性(a)describe方法该方法描述
2020-06-27 19:55:03 1012
原创 第7章 文本数据
这里写自定义目录标题一、string类型的性质1. string与object的区别2. string类型的转换合理的创建标题,有助于目录的生成二、拆分与拼接1. str.split方法2. str.cat方法三、替换1. str.replace的常见用法2. 子组与函数替换3. 关于str.replace的注意事项四、子串匹配与提取1. str.extract方法2. str.extractall方法3. str.contains和str.match五、常用字符串方法1. 过滤型方法2. isnumeri
2020-06-26 15:13:13 387
原创 第六章缺失值处理pandas
目录标题第六章缺失数据缺失观测及其类型检测缺失值isna和notna返回布尔值isna()是查找是缺失值的返回True,反之Falsenotna()查找不是缺失值的,返回值跟上面相反可以添加sum()来统计每行每列的缺失值个数也可以通过info来查看缺信息np.nan的几个知识点Nullable类型与NA符号Nullable整形Nullable布尔string类型NA的特性逻辑运算算术运算和比较运算convert_dtypes方法缺失数据的运算与分组加号与乘号规则groupby方法中的缺失值填充与剔除fil
2020-06-23 15:09:17 1130
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人