Pandas
Pandas基础
疯子书生z
这个作者很懒,什么都没留下…
展开
-
pandas ----数据分类(category)
目录1.category的创建及其性质1.1. 分类变量的创建1.2. 分类变量的结构1.3. 类别的修改2.分类变量的排序2.1. 序的建立3.分类变量的比较操作3.1. 与标量或等长序列的比较3.2. 与另一分类变量的比较1.category的创建及其性质这是对pandas分类数据类型的介绍,包括与R的简短比较factor。category是与统计中分类变量相对应的 pandas数据类型...原创 2020-05-08 11:20:10 · 3114 阅读 · 0 评论 -
pandas ------ 文本类型数据处理
目录1. string类型的性质1.1. string与object的区别2. string类型的转换2.拆分与拼接2.1. str.split方法2.2. str.cat方法3.替换3.1. str.replace的常见用法3.2. 子组与函数替换4.子串匹配与提取4.1. str.extract方法4.2. str.extractall方法4.3. str.contains和str.match...原创 2020-05-06 17:28:02 · 997 阅读 · 0 评论 -
pandas -----缺失数据处理
目录一、缺失观测及其类型1.1. 了解缺失信息1.2. 三种缺失符号1.3. Nullable类型与NA符号1.4. NA的特性1.5. convert_dtypes方法二、缺失数据的运算与分组2.1. 加号与乘号规则2.2. groupby方法中的缺失值三、填充与剔除3.1. fillna方法3.2. dropna方法四、插值(interpolation)4.1. 线性插值4.2. 高级插值方法...原创 2020-05-04 15:04:35 · 1210 阅读 · 0 评论 -
pandas -----合并全集(append、aassign、combine、upadte、concate、merge、join)
目录1.导入数据2.append与assign2.1 append方法2.2. assign方法3.combine与update3.1. comine方法1.导入数据import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()SchoolClassIDGenderAd...原创 2020-04-30 17:36:18 · 585 阅读 · 0 评论 -
pandas -----变形(透视表、melt、stack、unstack),哑变量与因子变化
目录导入数据1. 透视表1. 1 pivot1.2. pivot_table1.3 crosstab(交叉表)2.其他变形方法2.1. melt2.2. 压缩与展开3.哑变量与因子化3.1. Dummy Variable(哑变量)3.2. factorize方法5.练习导入数据import numpy as npimport pandas as pddf = pd.read_csv('da...原创 2020-04-26 17:26:43 · 1435 阅读 · 1 评论 -
数据挖掘---- pandas之索引
目录1.单级索引1. 1 loc方法、iloc方法、[ ]操作符1.1.1 loc方法(注意:所有在loc中使用的切片全部包含右端点!)1.1.2 iloc方法(注意与loc不同,切片右端点不包含)1.2 布尔索引1.2.1 布尔符号:'&','|','~':分别代表和and,或or,取反not1.2.2 isin方法1.2.3 快速标量索引1.2.4 区间索引1.2.4.1利用inte...原创 2020-04-21 17:56:36 · 568 阅读 · 0 评论 -
数据挖掘 -------pandas基础(文件读写、数据结构、常用基本函数)
目录1.简介2. 文件读写2.1读取2.2 写入2.3 pandas数据结构2.3.1 Series2.3.2DataFrame3.常用基本函数3.1. head和tail3.2 unique和nunique3.3 count和value_counts3.4 describe和info3.5 idxmax和nlargest3.6 clip和replace3.7 apply函数4.排序4.1索引排序...原创 2020-04-19 17:34:13 · 983 阅读 · 0 评论