pandas
文章平均质量分 93
尽力而为还不够
这个作者很懒,什么都没留下…
展开
-
pandas7-缺失数据
第七章 缺失数据一、缺失值的统计和删除缺失信息的统计2. 缺失信息的删除二、缺失值的填充和插值1. 利用fillna进行填充2. 插值函数三、Nullable类型1. 缺失记号及其缺陷2. Nullable类型的性质3. 缺失数据的计算和分组四、练习import numpy as npimport pandas as pd一、缺失值的统计和删除缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,通过和 sum 的组合可以计算出每列缺失值的原创 2021-01-03 23:39:54 · 191 阅读 · 0 评论 -
pandas7- 连接
pandas6- 连接6.1 关系型连接6.1.1 连接的基本概念6.1.2 值连接6.1.3 索引连接6.2 方向连接6.2.1 concat6.2.2 序列与表的合并6.3 类连接操作6.3.1 比较6.3.2 组合6.4 练习6.4.1 Ex1:美国疫情数据集6.4.2 Ex2:实现join 函数6.1 关系型连接6.1.1 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照姓名和班级连接成总的成绩表,又例如对企业员工的各类信息表按照原创 2020-12-29 21:21:26 · 148 阅读 · 0 评论 -
变形
5.1 长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:import numpy as npimport pandas as pdpd.DataFrame({'Gender':['F','F','M','M'],'Height':[163, 160, 175, 180]})原创 2020-12-27 22:01:24 · 244 阅读 · 1 评论 -
pandas4-索引
分组4.1.1 分组的一般模式4.1.2 分组依据的本质4.1.3 Groupby 对象4.1.4 分组的三大操作4.2 聚合函数4.2.1 内置聚合函数4.2.2 agg 方法4.3 变换和过滤4.3.1 变换函数与transform 方法4.3.2 组索引与过滤4.4 跨列分组4.4 apply 的引入4.4.2 apply 的使用4.5 练习Ex1:汽车数据集4.5.2 Ex2:实现transform 函数##4.1 分组模式及其对象4.1.1 分组的一般模式分组操作在日常生活中使用极其广泛,原创 2020-12-23 10:31:11 · 166 阅读 · 0 评论 -
索引器
索引3.1 索引器3.1.1表的列索引3.1.2 序列的行索引3.1.3 loc 索引器3.1.4 iloc 索引器3.1.5 query 方法3.1.6 随机抽样3.2多级索引多级索引及其表的结构多级索引中的loc 索引器3.2.3IndexSlice 对象3.2.4 多级索引的构造3.3 索引的常用方法3.3.1 索引层的交换和删除3.3.2 索引属性的修改3.3.3 索引的设置与重置3.3.4 索引的变形3.4 索引运算3.4.1 集合的运算法则3.4.2 一般的索引运算3.5 练习Ex1:公司员工原创 2020-12-20 23:59:12 · 505 阅读 · 0 评论 -
pandas 基础
Pandas 基础2.1 文件的读取和写入2.1.1 文件读取2.1.2 数据写入3.1 基本数据结构3.1.1 Series3.1.2 DataFrame4.1 常用基本函数4.1.1 汇总函数4.1.2 特征统计函数4.1.3 唯一值函数4.1.4 替换函数4.1原创 2020-12-18 22:21:12 · 781 阅读 · 1 评论 -
python基础
1预备基础1.1 Python 基础1.1.1 列表推导式与条件赋值1.1.2 匿名函数与map 方法1.1.3 zip对象与enumerate 方法2.1 Numpy 基础2.1.1 np 数组的构造2.1.2 np 数组的变形与合并2.1.3 np 数组的切片与索引2.1.4 常用函数2.1.5原创 2020-12-16 11:16:36 · 684 阅读 · 0 评论