![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
spring小郭
这个作者很懒,什么都没留下…
展开
-
Task05:基于pandas综合练习
Task05:综合练习一、端午节的淘宝粽子交易问题(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共原创 2020-07-01 20:35:33 · 188 阅读 · 0 评论 -
时序数据的创建
Task04:时序数据一、时序的创建1. 四类时间变量元素类型 创建⽅式名称 :① Date times(时间点/时刻) 描述:描述特定⽇期或时间点 元素类型:Timestamp 创建方式:to_datetime或date_range② 名称:Time spans(时间段/时期) 描述:由时间点定义的⼀段时期 元素类型:Period 创建方式:Period或period_range③名称: Date offsets(相对时间差) 描述:⼀段时间的相对⼤小(与夏/原创 2020-06-29 22:26:29 · 416 阅读 · 0 评论 -
分类数据的创建及排序
Task03:分类数据分类数据类型在以下情况下非常有用 :一个字符串变量,只包含几个不同的值。将这样的字符串变量转换为分类变量将会节省一些内存。变量的词汇顺序与逻辑顺序(“one”,“two”,“three”)不同。 通过转换为分类并指定类别上的顺序,排序和最小/最大将使用逻辑顺序,而不是词法顺序。作为其他python库的一个信号,这个列应该被当作一个分类变量(例如,使用合适的统计方法或plot类型)。分类数据Task03:分类数据⼀、category的创建及其性质1. 类变量的创建1.1.1.⽤原创 2020-06-27 20:06:28 · 257 阅读 · 0 评论 -
⽂本数据
Task02:文本数据⼀、string类型的性质string类型和object不同之处:① 字存⽅法(string accessor methodsstr.count)会回相应数据的Nullable类型而object会随失值的存在而改变回类型② Series⽅法不在string上使⽤例 Series.str.decode()因为存储的是字串而不是字节③ string类型在失值存储或运时类型会⼴为pd.NA而不是浮点型np.nan其余部内容在当本下完⼀但合Pandas的发展式我们仍部⽤string原创 2020-06-26 21:49:15 · 290 阅读 · 0 评论 -
基于pandas缺失数据处理
一、处理缺失值缺失数据会在很多的数据分析中出现,而pandas的目标之一就是尽可能无痛地处理缺失数据值。对于pandas对象中表现出缺失值并不完整,可是对于大部分用户是可用的。对于数值型数据,pandas使用浮点值NaN,我们称NaN为容易检测到的标识值。...原创 2020-06-23 21:24:55 · 262 阅读 · 0 评论