Pandas学习笔记
Datawhale组队学习—— 快乐pandas 学习记录
KF_Guan
那云朵上的风景,只有与山齐高者才能看见。
展开
-
Pandas学习总结——9.时序数据处理
本节介绍Pandas的时序数据处理的一些方法。包括四类时间变量、时间点创建(to_datetime方法、date_range方法、dateoffset对象)、时序的索引和一些基本属性操作、重采样和一些窗口函数原创 2020-06-28 10:10:38 · 1120 阅读 · 0 评论 -
Pandas学习总结——8.分类数据
1 category的创建及其性质1.1 分类变量的创建四类创建方法:Series对DataFrame指定类型使用内置Categorical类型使用cut函数# Series方法创建pd.Series(["a", "b", "c", "a"], dtype="category")# 对DataFrame指定类型temp_df = pd.DataFrame({'A':pd.Series(["a", "b", "c", "a"], dtype="category"),'B':lis原创 2020-06-27 16:26:15 · 304 阅读 · 0 评论 -
Pandas学习总结——7. 文本数据处理
已学习完成,博客内容整理中…原创 2020-06-26 23:07:41 · 688 阅读 · 0 评论 -
Pandas学习总结——6. 缺失数据处理
目录1 缺失值特性1.1 三种缺失值符号1.2 Nullable类型1.3 convert_dtypes方法2 缺失数据的运算规则2.1 普通运算2.2 groupby方法中的缺失值3 缺失数据的一些处理方法3.1 填充(fillna方法)3.2 剔除(dropna方法)3.3 插值(interpolation)3.3.1 线性插值3.3.2 高级插值方法3.3.3 interpolate中的参数**内容简介:**本篇首先介绍Pandas中的三种缺失值符号,针对其弊端介绍Nullab原创 2020-06-23 21:02:02 · 872 阅读 · 0 评论 -
Pandas组队学习(上)——综合练习题答案
第一阶段学习总结:Datawhale组织的Pandas组队学习暂告一段落。快乐pandas以自主学习、助教答疑、定期打卡等形式,课程资料编写比较详细,配合思考题和练习巩固,无奈于本人较菜,对所学的知识掌握还不够透彻,完成这次综合练习断断续续花了两天时间,后面一定要抽时间复盘之前所学的内容。全面学习基础内容有助于建立体系,了解各大功能模块,在使用时才能有所了解,找准方向。因此后面会继续参加pand...原创 2020-05-01 16:45:50 · 1207 阅读 · 0 评论 -
Pandas学习总结——5. 合并(append与assign、combine与update、concat、merge与join)
内容概览1 append与assign1.1append方法1.2 assign方法2 combine与update2.1 combine方法2.2 update方法3 concat方法4 merge与join4.1 merge函数4.2 join函数5 问题与练习5.1 问题5.2 练习练习一:公司员工信息练习二:课程分数表Pandas的合并操作可以概括为以下四类方法:append与ass...原创 2020-04-29 16:28:50 · 1403 阅读 · 0 评论 -
Pandas学习总结——4. Pandas变形 之 透视表 & 变形方法
文章目录1 透视表1.1 pivot与pivot_table1.2 交叉表(crosstab)2 其他变形方法2.1 melt2.2 压缩与展开(stack 和 unstack)3 哑变量与因子化3.1 Dummy Variable(哑变量)3.2 factorize方法4 问题与练习4.1 问题1 透视表1.1 pivot与pivot_tablepivot函数可将某一列作为新的cols。...原创 2020-04-28 23:16:24 · 831 阅读 · 0 评论 -
Pandas学习总结——3. Pandas分组 都有哪些操作?
目录1 groupby函数1.1 分组的依据1.2 组的遍历1.3 level参数(用于多级索引)和axis参数1.4 groupby对象的特点2 聚合、过滤和变换2.1 聚合(Aggregation)2.2 过滤(Filteration)2.3 变换(Transformation)3 apply函数3.1 apply函数的灵活性3.2 应用apply同时统计多个指标SAC过程(s...原创 2020-04-26 23:31:00 · 534 阅读 · 0 评论 -
Pandas学习总结——2. 一文详述 Pandas索引
目录Pandas单级索引1. loc、iloc、[]操作符2. 布尔索引3 标量索引4 区间索引Pandas多级索引1 多层索引的创建2 多层索引切片3 多层索引的slice对象4 索引层交换索引设定常用索引型函数1 where()和mask()2 query()函数重复元素处理(duplicated和drop_duplicates)抽样函数(sample)上篇文章介绍了Pan...原创 2020-04-23 23:19:00 · 924 阅读 · 0 评论 -
Pandas学习总结——1. 基础操作(文件读写)、数据结构(Series、DataFrame)、常用基本函数、数据排序...
目录1 Pandas文件读取和写入1.1 文件读取(csv、txt、xls/xlsx)1.2 文件写入(csv、xls/xlsx)2 Pandas基本数据结构(Series、Dataframe)2.1 Series2.2 DataFrame3 Pandas常用基本函数(1) head和tail(2) unique和nunique(3) count和value_counts(4) d...原创 2020-04-20 10:31:00 · 1017 阅读 · 0 评论