![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas
ckSpark
爱好摄影、探险,终生学习
展开
-
Python-Pandas之索引index相关函数
本文介绍对索引进行 重新排序 以及 更换索引 时的用法,需要注意的是索引对象是无法进行修改的。重新索引 .reindex()reindex函数参数类型使用说明index用于索引的新序列method填充缺失值方法fill_value缺失值替代值limit最大填充通过与array以及series对比进行学习,会更清楚DataFrame的用法和特点。更换索引 .set_index()...原创 2020-09-06 22:42:42 · 3276 阅读 · 0 评论 -
Python-缺失值分类及Pandas中缺失数据处理函数
一、Python中缺失值分类Python中有三种缺失值(空值):| 形式 |含义 ||–|--|| None | Python内置的None值,如创建一个空的列表list=[] || NA | 在pandas中,将缺失值表示为NA,表示不可用not available,主要表示为np.nan|| NaN | 对于数值数据,pandas使用浮点值NaN(Not a Number)表示...原创 2018-10-21 00:32:16 · 6576 阅读 · 1 评论 -
Pandas-object字符类型转时间类型to_datetime()函数
一、pandas中to_datetime()函数可以将指定数据转换为相应格式的时间类型数据pandas.to_datetime(arg,format=None, exact=True, unit=None)参数含义arg需要转换类型的数据format需要输出为时间类型的格式unit最小时间间隔,如’D’代表一天二、函数实例将数据框中ob...原创 2018-10-24 23:40:19 · 37624 阅读 · 2 评论 -
Pandas-去除重复项函数drop_duplicates()
一、drop_duplicates函数用途pandas中的drop_duplicates()函数可以通过SQL中关键字distinct的用法来理解,根据指定的字段对数据集进行去重处理。二、drop_duplicates()函数的具体参数用法:DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)...原创 2018-10-28 00:34:27 · 25047 阅读 · 1 评论 -
Python-辨析type/dtype/astype用法
Python中与数据类型相关函数及属性有如下三个:type/dtype/astype。名称描述type()返回参数的数据类型dtype返回数组中元素的数据类型astype()对数据类型进行转换type()用于获取数据类型#type用于获取数据类型import numpy as npa=[1,2,3]print(type(a))#>&...原创 2018-11-07 20:43:21 · 11499 阅读 · 0 评论 -
Python-Groupby函数应用
Pandas分组和聚合运算–Groupby函数应用一、groupby函数功能根据一个或多个键拆分pandas对象,计算分组摘要统计,如计数、平均值、标准差或用户自定义函数等。二、groupby函数原理可将groupby函数分组聚合的过程分为两步:1、分组split:按照指定键值或分组变量对数据分组2、聚合combine:应用python自带函数或自定义函数进行聚合计算eg.1.分组...原创 2018-11-17 20:32:49 · 17632 阅读 · 0 评论