Pandas笔记
文章平均质量分 83
芒果去核
纵有疾风起,人生不言弃
展开
-
pandas.cut()函数的使用
文章目录1. 语法及参数2. 参数详解(含实例)2.1 bins2.2 retbins2.3 precision2.4 labels2.5 ordered2.6 right2.7 include_lowest2.8 duplicatespandas.cut()函数可以将数据进行分类成不同的区间值。在数据分析中,例如有一组年龄数据,现在需要对不同的年龄层次的用户进行分析,那么我们可以根据不同年龄层次所对应的年龄段来作为划分区间,例如 bins = [1,28,50,150],对应 labels = [“青少原创 2022-03-23 00:26:39 · 20829 阅读 · 2 评论 -
pandas 数据清洗和预处理
pandas 笔记010目录pandas 笔记010十、数据清洗和预处理1. 处理缺失数据1.1 判断是否存在缺失值 isnull()1.2 丢弃缺失数据 dropna()1.3 填充缺失值 fillna()1.3.1 精确填充1.3.2 参数inplace=True1.3.3 参数method='ffill'1.3.4 参数limit2. 数据转换2.1 移除重复值2.1.1 duplicated():检查是否为重复行2.1.2 drop_duplicates()过滤重复行2.1.3 keep='la原创 2021-11-09 00:13:20 · 971 阅读 · 0 评论 -
Pandas读写文件
pandas 笔记009目录pandas 笔记009九、Pandas文件操作1.读1.1 read_csv()1.2 read_table()1.3 sep或delimiter(分隔符)1.4 skiprows(忽略跳过行数)1.5 header(设置列名)1.6 names(指定列名)1.7 index_col1.8 读取txt文件2.分块读取2.1 chunksize2.2 iterator3.将一个文件内容写到另一个文件九、Pandas文件操作1.读import numpy as n原创 2021-11-06 12:04:28 · 757 阅读 · 0 评论 -
pandas统计计算方法
pandas 笔记008目录pandas 笔记008八、pandas统计计算方法1.主要统计方法2. 示例一些方法2.1 sum()2.2 idxmax() 和 idxmin()2.3 cumsum()2.4 describe八、pandas统计计算方法1.主要统计方法方法说明count非NAN值的数量describe针对Series或各DataFrame列计算汇总统计min、max计算最小值和最大值argmin. argmax计算能够获取到最小值和最大原创 2021-11-04 00:28:10 · 4558 阅读 · 0 评论 -
pandas 层级索引
pandas 笔记007目录pandas 笔记007七、层级索引1. 层级索引(hierarchical indexing)1.1 Series1.2 DataFrame2. 交换2.1 交换分层顺序2.2 排序分层2.3 交换并排序分层七、层级索引import pandas as pdimport numpy as np1. 层级索引(hierarchical indexing)1.1 Series创建Series使用Index指定内外索引,第一个内层列表是外层索引,第二个内层列表内层索引原创 2021-11-01 00:34:20 · 1299 阅读 · 0 评论 -
pandas函数应用
pandas 笔记006目录pandas 笔记006六、pandas函数应用1. apply 和 applymap1.1 可以直接使用numpy的函数1.2 通过apply将函数应用到列或行1.3通过applymap将函数应用到每个数据2.排序2.1 按索引排序(sort_index())2.1.1 Series2.1.2 DataFrame2.2 按值排序(sort_values())2.2.1 Series2.2.2 DataFrame3.唯一值和成员属性3.1 unique()3.2 value_原创 2021-10-29 01:24:24 · 625 阅读 · 0 评论 -
pandas的对齐运算
pandas 笔记005目录pandas 笔记005五、对齐运算1.算术运算和数据对齐1.1 Series1.2 DataFrame2.使用填充值的算术方法2.1 Series2.2 DataFrame3.DataFrame和Series混合运算3.1 按行广播3.2 按列广播五、对齐运算1.算术运算和数据对齐import numpy as npimport pandas as pd1.1 Seriesa1 = pd.Series(np.arange(4),index=['a','b','c原创 2021-10-27 16:20:01 · 736 阅读 · 0 评论 -
索引对象Index和索引的基本操作
pandas 笔记004目录pandas 笔记004四、索引对象Index和索引的基本操作1. 索引对象Index1.1 Series和DataFrame1.2 索引对象不可变1.3 常见的Index种类2. 索引的 一些基本操作2.1 重新索引 reindex2.1.1 Series索引2.1.2 DataFrame索引2.2 增2.2.1 Series索引2.2.2 DataFrame索引2.3 删2.3.1 del2.3.2 drop2.4 改2.4.1 Series索引2.4.2 D原创 2021-10-26 22:15:31 · 1493 阅读 · 0 评论 -
DataFrame索引的创建和基本用法
pandas 笔记003目录pandas 笔记003三、DataFrame索引的创建和基本用法1.DataFrame索引的创建1.1 字典类构造dataframe1.1.1 数组、列表或元组构成的字典构造dataframe1.1.2 Series构成的字典构造dataframe1.1.3 字典构成的字典构造dataframe(字典嵌套)1.2 列表类构造dataframe1.2.1 通过 2D ndarray(二维数组) 构造dataframe1.2.2 字典构成的列表构造dataframe原创 2021-10-25 19:06:57 · 10090 阅读 · 0 评论 -
Pandas中Series索引的创建和基本用法
pandas 笔记002目录pandas 笔记002二、Series索引的创建和基本用法1.Series索引的创建1.1 通过列表创建Series索引1.2 通过numpy创建的数组来创建Series索引1.3 通过字典(无序数据类型)创建Series索引2. Seies索引的基本用法2.1 values 获取数据2.2 index 获取索引2.3 下标取值2.4 切片2.5 布尔索引2.6 isnull和notnull检查缺失值2.7 name属性2.8 head() 获取索引的原创 2021-10-24 21:10:00 · 8108 阅读 · 0 评论 -
pandas初识
pandas笔记001目录pandas笔记001一、pandas初识1.简介2.Windows安装简介2.1 依赖2.2 通过PyPI的`pip`安装2.3 通过 Anaconda 环境安装3. 官方网址一、pandas初识1.简介pandas 是一个Python包,基于 numpy, python-dateutil, pytz,提供快速、灵活和富有表现力的数据结构,旨在使处理“关系”或“标记”数据既简单又直观。pandas 的两个主要数据结构是Series(一维标记的同构数组)和DataFrame原创 2021-10-24 13:47:07 · 785 阅读 · 0 评论